「この度は取材をお受けしましたが、どう対応したらよいか。今でも迷いがあります」。担当者は取材の冒頭で、心境をこう吐露した。

 記者は取材のためレンタルサーバー事業を手掛けるファーストサーバ(本社:大阪市)を訪れた。1年半ほど前に、顧客企業が利用していたサーバー約5700台のデータをほぼ消失させる大規模障害を起こした事業者だ。

 今回の取材は、過去に失敗を経験した複数の企業や公的団体に申し込んだ。目的は、「IT運用の失敗から技術者がどう学び、再発防止に取り組むべきか」をまとめる企画記事を執筆するためだ。

 中でもファーストサーバは、運用のプロであるべきITベンダーが、一部とはいえ現場担当者のずさんな運用作業を見逃していた実態が明るみになり、個人としても大きな衝撃を受けた。失敗を経てどう体制を立て直したのか、大いに興味があった。

「非技術者」にも分かる再発防止策を:ファーストサーバ

 簡単に、ファーストサーバの事故を振り返っておこう(関連記事1:ファーストサーバの障害でデータ消失、関連記事2:ファーストサーバ最終報告書、ベテラン担当者のマニュアル無視を黙認、関連記事3:【週末スペシャル】ファーストサーバ事故 12億円の教訓)。

 同社が、顧客にレンタルで提供していたサーバーをダウンさせたのは2012年6月20日。事故の原因は、OSのセキュリティパッチを適用していた一人の運用担当者の作業ミスだった。パッチ適用には不要だった「サーバーデータの一括削除」コマンドが入ったスクリプトを、検証が不十分なまま本番環境に適用してしまった。これが原因で、サーバーにあった顧客データを次々と消去してしまった。

写真1●ファーストサーバで再発防止活動を指揮した村竹雅人取締役社長室長
写真1●ファーストサーバで再発防止活動を指揮した村竹雅人取締役社長室長。事件当時はマスコミ対応も担当した。

 この担当者は、様々な運用作業に一つのスクリプトに手を加えて使い回していたほか、障害を起こした当日に会議中で不在だった上司の承認を経ずに、作業を進めてしまっていた。担当者個人はもとより、組織の在り方にも問題があることは明らかだ。

 正直なところ、ファーストサーバが今回の取材依頼を受諾することは予想していなかった。なぜなら、2012年の事故当時、同社は一貫して直接の取材を拒んでいたからだ。経営陣が会見などで事故状況を直接説明する場を設けることはなく、状況説明は主にホームページでの告知や報告書の公表だけ。マスコミからの問い合わせには、広報担当を兼ねていた村竹雅人社長室長(当時)が、ただ一人で電話で対応していた(写真1)。