あっ、と気づいたときは手遅れだ。
運用操作を間違えた、パラメータの変更を忘れた、障害対応を誤った――。
作業者の「うっかりミス」によるシステム障害が止まらない。
本誌が過去3年に発生したトラブルの原因を調べたところ、全体の半分に達した。
作業者を責めたり責任者を処罰したりしても、ミスは減らない。 ミスを誘発する根本的な原因を突き止めて対策を講じることが不可欠だ。
うっかりミスを無くす方策を探る。


(大和田 尚孝)

◆トラブル原因の半分が「うっかり」
◆鉄道に学ぶ、全員参加のミス削減運動
◆しかるより真因を追究、対策べからず集


【無料】サンプル版を差し上げます 本記事は日経コンピュータ7月15日号からの抜粋です。そのため図や表が一部割愛されていることをあらかじめご了承ください。本「特集1」の全文をお読みいただける【無料】サンプル版を差し上げます。お申込みはこちらでお受けしています。 なお本号のご購入はバックナンバーをご利用ください。

 「ミサイル発射情報、当地域にミサイルが着弾する恐れがあります」。6月30日午後4時37分、福井県美浜町全域に緊急放送が響き渡った。

 原子力発電所が狙われたのか─―。屋外の防災無線58基からの「誤報」に、住民は一時騒然となった。

 誤報は、津波や地震、ミサイル発射などの緊急情報を全国の市町村に送る消防庁の「全国瞬時警報システム(J-ALERT)」を通じて伝わった。美浜町の職員が消防庁の指示でJ-ALERTの受信装置を修理した直後だ。

 原因は、動作確認に使った試験用の警報データの消去漏れだ。受信装置に残った警報が修理後に流れた。消防庁とJ-ALERTの開発ベンダーが作成した修理手順に抜けがあった。実はJ-ALERTは「訓練です」といった音声で始まる訓練報を流せる。これなら誤って放送しても影響は小さい。ところがなぜか本物の警報を使ってしまった。

ATM障害、電車の緊急停止も

 美浜町のケースは他人事ではない。パラメータ変更を忘れた、切り替え時の設定を誤った、運用操作を間違えた、といった「うっかりミス」によるトラブルが相次いでいる。

 この3カ月だけ見ても、6月12日にはNTTドコモがiモードのメニュー表示順序を決める入札システムの金額表示設定を誤り、落札30分前から非開示にするはずの入札額を落札直前まで公表してしまった。6月2日に山形県で基幹ネットワークに異常が起きて100種類の行政システムが使えなくなったのは、通信機器の部品を交換する際の設定ミスだった。

 「8年ぶりの作業だったため、責任者の私を含め十分な確認ができなかった」。5月19日にATM障害を起こした住友信託銀行の岡崎健一システム推進部長は、悔しさをにじませる。原因はトラブル前日のシステム変更漏れだった。6月から900台の営業店端末を順次刷新するのに伴う事前作業だ。営業店端末の登録作業は正常に完了したが、勘定系システムに接続する端末数の設定値を増やし忘れた。新旧端末の並存期間は端末数が一時的に増える。にもかかわらず上限値を見直さなかった。

 5月12日には三菱東京UFJ銀行のシステム統合に伴う切り替え作業のミスにより、一部カードがセブン銀行で使えなくなった。同じ日に京浜急行電鉄の電車が緊急停止したのは、地震速報の受信装置の設定ミスでテスト報を本物と誤ったのが原因だった。

 トラブル原因に占めるうっかりミスの割合はどの程度なのか。本誌は過去3年にさかのぼり、誌面およびWebサイト「ITpro」で取り上げたシステム障害のうち、原因が判明している125件を抽出して4種類に分類してみた。一つがアプリケーションやミドルウエア、OSといった「ソフトの不具合」だ。あとはアクセスの集中などによる「性能・容量不足」、サーバーや通信機器の「ハード故障」、それに「うっかりミス」だ。結果はうっかりミスが最多で49%に上った()。ほぼ2件に1件の割合である。

図●過去3年に本誌が取り上げたシステム障害の原因別割合
図●過去3年に本誌が取り上げたシステム障害の原因別割合
「うっかりミス」が49%で最多だ

「テストでは正常だったのに」

 うっかりミスが止まらないのはなぜか。まず考えられるのは、テストで見つけるのが難しいことだ。例えば本番環境のパラメータを手作業で変更する場合、テスト環境では間違いがないかどうか確認できない。本番環境を使ったリハーサルでならチェックはできるが、それでも切り替え当日に作業ミスをするリスクは残る。

 最たる例が、文部科学省の「高等学校卒業程度認定試験(旧大検)」の採点システムで発生した不具合である。昨年12月に「世界史A」の選択問題が実質0点扱いとなっている事実が見つかった。過去にさかのぼって調査した結果、2005年から07年までに実施した計6回の試験で、合計1901人が本来なら合格だったにもかかわらず不合格と判定されていた。

 この試験はマークシートを利用していて、採点はすべてコンピュータで自動処理する。採点システムは、試験科目ごとに選択問題の数を示すパラメータを設けている。正しくは「2」あるいは年度によっては「4」と入力すべきだったが、なぜか「0」となっていた。このため、選択問題には合計6点もしくは12点を配点するはずが、回答内容にかかわらず全員0点となった。


続きは日経コンピュータ7月15日号をお読み下さい。この号のご購入はバックナンバーをご利用ください。