ヤフー子会社でサーバーホスティングを手がける、ファーストサーバの大規模障害の波紋が広がっている。5万契約のサーバーのうち約5700契約が対象で、バックアップのデータも消失してしまった。何重ものミスで顧客に大きな損害を与えており、サーバー運用者としての責任は重い。

 「当初は問い合わせの電話がつながらず、情報発信も足りなかった。再発防止策が不十分なら、乗り換えも検討する」。Webサイトの運用サービスを利用していたある企業ユーザーは憤る。

表●障害で影響を受けた主な企業
[画像のクリックで拡大表示]

 ユーザーの8割は法人。ネット通販事業者も使っており、ビジネスの機会を損失した企業も少なくない()。さらに、ファーストサーバはサイボウズの代理店として、Webグループウエア「Office 9」をSaaS(ソフトウエア・アズ・ア・サービス)として提供。利用企業のうち149社がデータ消失などの影響を受けた。

 今回の障害は、データ消失という深刻度において「過去最悪の障害」(ITベンダーの技術者)。直接的な原因は、人為ミスや運用のまずさが重なったことだ。

 障害が発生したのは2012年6月20日午後5時30分ごろ。運用担当の技術者がサーバーOSの脆弱性を修正するパッチを適用する際、プログラムに「パッチ不要のサーバーは、ユーザーファイルなどを一括削除」という誤った処理のコマンドを入れてしまった。

 結果として、パッチが不要な約5700契約分のデータが消去された。一括消去のコマンドは本来、「コメントアウト」で無効にしておくべきものだった。一つのプログラムに複数作業のコマンドを含めるという極めて危険な作業をしていたのが、そもそもの原因だ。

 担当技術者はテスト環境でプログラムを実行した。しかしパッチを適用するサーバーは確認したが、他のサーバーに対する影響を見逃した。テストには監督者も同席していたが、同じ範囲しか検証していない。

 さらに運用のまずさが重なる。パッチをバックアップサーバーにも同時に適用したため、データを同時に消し去った。有事にパッチを適用していないバックアップサーバ ーが起動するのを防ぐためという。ただし同時に適用していなければ、毎朝6時のバックアップ時点までは復旧できたはずだ。

 外部のストレージにバックアップデータを保存しない運用も問題視されている。同社の一部のカタログでは「外部サーバーに保存する」との説明もあり、事故後に修正する一幕があった。

 現在もファーストサーバのサービスは継続しており、全ユーザーが納得する再発防止策を早急に策定するべきだ。損害賠償については「約款通り、ユーザーがこれまで支払った料金の総額を上限に対応する」と説明する。しかし、消失したデータは戻らない。ユーザー企業はローカルのバックアップなど、最終手段を再確認する機会とするべきだ。