IT現場には今,大規模地震などの自然災害とともに,新型インフルエンザへの対策が求められている。特に2009年から現在にかけては,多くの企業がBCP(事業継続計画)の中にパンデミック(感染症の世界的な大流行)対策を盛り込むようになった。対策の一環として訓練を実施した現場では,人の行動や判断に関する課題が浮き彫りになった。システムの災害対策が万全でも,それを扱う人の役割を軽視すれば期待する成果は得られない。

写真1●左からコベルコシステムの林秀明氏,神戸製鋼所の林高弘氏,コベルコシステムの小山稔晃氏
写真1●左からコベルコシステムの林秀明氏,神戸製鋼所の林高弘氏,コベルコシステムの小山稔晃氏
図1●大規模地震を想定した訓練で課題を洗い出している神戸製鋼所とコベルコシステム<br>2カ所のデータセンターで相互にバックアップするシステムの切り替え訓練を年3回実施することで,手順書が分かりにくいといった課題を洗い出している
図1●大規模地震を想定した訓練で課題を洗い出している神戸製鋼所とコベルコシステム
2カ所のデータセンターで相互にバックアップするシステムの切り替え訓練を年3回実施することで,手順書が分かりにくいといった課題を洗い出している
[画像のクリックで拡大表示]

 神戸製鋼所は1995年の阪神・淡路大震災で被災した経験をもとに,基幹システムの災害対策を段階的に推進してきた。2006年には,神戸市のデータセンターと兵庫県加古川市のデータセンター間で,主要システムのプログラムとデータをほぼリアルタイムで相互に同期する仕組みを構築。「一方のデータセンターが停止しても,もう一方のセンターにある予備系システムで製品出荷などの主要業務を継続できるようにした」(神戸製鋼所 IT企画部 次長 林高弘氏,写真1)。

 構築した予備系システムが適切に機能することを確認するために,同社はグループ情報システム会社のコベルコシステムとともに,毎年訓練を実施している。予備系への切り替えは基本的に人手で行う。訓練では手順に沿って,予備系のホストとサーバーを起動し,そこにクライアントを実際に接続する。毎回,30~50人が参加する。

 訓練では毎回さまざまな課題が見つかる。過去に見つけた課題を,ここで断片的に再現してみる(図1)。

● 連絡してもつながらない

 午前10時。震度7の地震で基幹システムが被災。すぐ対策本部が組織され,各現場に状況報告をするよう携帯メールで指示する。しかし,返事がないところが予想より多い。連絡網は頻繁に更新しているつもりだが,エラー・メールも戻ってこない。「なぜだろう」と担当者は首をかしげる。

● 手順書作成者でないと分からない

 やがて予備系システムへの切り替え指示が現場に届いた。現場のエンジニアは予備系システムへの切り替え手順書を手に取り,コマンドを一つずつ打ち込む。ところが,あるコマンドを打ち終えたときに戸惑った。応答がないのだ。「このまま続けていいのか?この手順書を作成した担当者なら分かるのだろうが…」。判断に迷ううちに時間はどんどん過ぎていった。

● 実行権限がなくエラーに

 エンジニアは別のシステムに切り替えコマンドを打ち込んだ。すると,エラーが返ってきた。「そのエンジニアにはコマンドの実行権限がない」という内容のメッセージだった。

 ここで挙げたもの以外に,かつては「何をもってシステムの切り替えを決めるのか。基準を整理してほしいといった,判断基準について課題が指摘されたことがある」,とコベルコシステムの林秀明氏(ICTソリューション本部 SOシステム技術部 第1サーバーグループ グループ長)は語る。

 神戸製鋼所の事例は,災害対策向けのハードウエアやソフトウエアを導入しても,それだけでは十分とはいえないことを端的に示している。足りないものは何か。それは,「人(=復旧に当たるエンジニア)」への配慮だ。