昔体験した実話です。日記を整理していたら出てきましたのでご紹介いたします。
199x年x月x日。
この数日間は悪夢だった。
ファイルサーバがクラッシュ。バックアップは不完全。
重要なデータに限って、全部飛んだとの悲痛な報告が多数寄せられる。・・・あまりのショックに声が出ない。
どう見てもRAID5構成のクラッシュなのでデータ復旧なんてできるわけないとわかっていながら、藁にもすがる思いでユーザサポートに電話。サポート電話に出ていただいた方からは、いろいろな操作を教えてくださいながらも復旧は多分無理だという雰囲気が伝わってきて重い空気が流れる。
次の日の朝礼で社内向けにアナウンス。反応はない。皆すでに前日に十分ショックを受けているので改めて反応するまでもないとのことか。申し訳なさで胸が一杯になる。
夕方、サポートの方から一本の電話が入る。
「製造元の人がリモートで見てくれるそうです。」
おおお、そんなことができるのか。ちょっと期待する。が、多分だめだろうとも思う。とりあえず明日とのことなので明日まで待つ。
次の日の昼頃、ユーザサポートの方からまた電話が入る。
「製造元より連絡がきたのでメールの内容で対応してほしい。」
とのこと。どうやらサーバにグローバルIPアドレスを振りファイアウォールを通るようにすれば対応してくれるらしい。ちょっと心が躍り、すぐさま対応。
その後すぐに再度電話がある。
「製造元の準備ができたらしいのでいつ始めますか?」
え、そんなに早いの?すぐにでも対応してもらいたかったのですぐ対応いただけるようにお願いした。
数時間後にまた電話が入る。
「対応が終わったらしいので見てもらえますか?」
え、対応が終わったって? うそ、だましてない? と思いつつ見てみると、
「おおおおお、データが見えるようになっている。(感動で涙が止まりません)」
皆大喜びしたのは言うまでもありません。
ユーザサポートの皆さん、大変親切親身にご対応いただいて本当にありがとうございました。
今冷静になって当時を思い返してみると、実はRAID5の障害ではなくてファイルシステムの不整合が原因だったのかもしれませんが、今となっては真実はわかりません。
それにしても、失ってみて初めてわかったのがデータの重要さです。当時はRAID5+HotSpare構成だったので、よほどのことがないとファイルサーバがクラッシュするということがない、と甘く考えていました。バックアップをきちんと取っていなかった理由は、サーバ自体が死ぬことはないだろうという甘い考えに加えて、データ量が数TBにも達していて(当時の数TBはかなり大きい容量だった)、バックアップ装置を買う予算が取れず、かつ取れたとしてもバックアップに大変時間がかかることが予想され、いつかきちんとやろうという認識しかなかったためです。
というわけで、お恥ずかしながら反面教師としていただきたく、あえて昔の日記をご紹介させていただきました。皆様もどうかお気をつけください。