大規模地震やパンデミックといった災害が発生したとき,人は緊張や不安など強いストレスを受ける。そうした精神状態で業務継続に向けた行動や判断を行わなければならず,ミスや遅延を起こしやすい状況に置かれる。しかし,だからといって,災害時のシステムの切り替えなどをすべて自動化すれば,その構築・運用にかかるコスト負担は重くなってしまう。

 目指すべき災害対策は,人を中心にした仕組みだ。普段とは大きく異なる厳しい状況の中で,人を中心に機能するよう改善しておきたい。

 それは,どのような仕組みになるのか。ヒントは,災害対策訓練を通して得られた課題の中にある。訓練ではシステム面の課題も見つかるが,「人」にかかわる課題が多く洗い出される。それらを一つひとつ解決していけば,人を中心にした仕組みになる。

 連載第1回で登場した神戸製鋼所や富士フイルムコンピューターシステムをはじめ,訓練を実施した現場で見つかった主な課題を集めると四つにまとめることができる。

緊張感のある状況で改良点を発掘

 一つ目は「手順書が分かりにくい,操作ミスや遅延が発生する」という課題(図1)。これは,訓練を行うと必ずといっていいほど出てくる課題だ。連載第1回の神戸製鋼所の事例で,手順書を見てコマンドを打ち込むとき,操作に遅延が発生したケースを紹介した。このケースは応答メッセージがなくても正常だったのだが,手順書に「メッセージなし」という記述がなかったために遅延を招いてしまった。小さいことかもしれないが,人を中心に考えると大きな問題である。

図1●災害時のIT現場の活動を円滑にするための課題1
図1●災害時のIT現場の活動を円滑にするための課題1
[画像のクリックで拡大表示]

 ストレスのかかる状況でも操作ミスを起こしにくい手順書にするには,訓練という緊張感のある状況で担当者に実際に試してもらい,記憶が新しいうちに意見を収集するとよい。

 神戸製鋼所とコベルコシステムの場合は,見つけた事象を訓練の最中にホワイトボードへ書き出す(図2)。コベルコシステムは当日に振り返りまでを行い,「事象」「原因」「対応」という項目にまとめる。

図2●訓練という緊張感のある状況で改良点を見つける
図2●訓練という緊張感のある状況で改良点を見つける
神戸製鋼所とコベルコシステムは,見つけた事象を訓練の最中にホワイトボードへ書き出す

 例えば,「停止コマンド発行時にエラー」という事象が起こった。その原因は「担当者に権限がない」で,対策は「テンポラリーIDの運用を検討」といった具合だ。

 重視しているのは,初心者の目を持った人に課題を見つけてもらうことだ。コベルコシステムの小山稔晃氏(ICTソリューション本部 SOシステム技術部 第1サーバーグループ)は「あえて別のシステムの担当者や若手を検証にアサインし,誰でも実行できる手順書を目指している」という。