ジャスダック証券取引所の売買システムで8月29日に発生した障害をご記憶の方は多いだろう。会員企業のシステムから売買システムにうまく接続できない場合があるという不安定な状況になったため,午前中の全売買を停止させたというものだ(関連記事)。原因は,開発業務を委託していた日立製作所が,売買システムに対する接続数の上限を制御するパラメータ値を誤って変更したことだった。

 この保守改修は,数カ月以上前から3度のテストを経て実施した。その当初から,パラメータ値の誤りは見過ごされていたようだ。ジャスダック証券取引所の障害は2005年に入って3度目で,しかも2月の「取引開始の遅延」(関連記事),4月の「一部銘柄の売買停止」を越える,「全銘柄の売買を午前中停止」という障害規模ゆえに,マスコミからも注目された。

なぜ障害を繰り返すのか

 ジャスダック証券取引所の担当者らは,障害のたびに,被害を最小化する努力を重ね,原因を究明し,再発防止策を打とうと奔走してきたはずだ。こうした現場担当者の努力には,いつもながら頭が下がる。

 同社の名誉のために言っておくと,2005年に入って3回生じた障害の原因は,それぞれ異なっている。2月の障害の原因は,注文の取り消し依頼が想定以上に集中したことで安全装置が働いたことだった。4月は新規上場時の特別気配に関するプログラムのバグ,8月は既述の通り保守改修時のパラメータ値の変更ミスが原因であった。

 原因が異なっている以上,単純な繰り返しではないが,その一方で結果的に似たような障害が度重なっている事実に疑問も覚える。「障害を繰り返してしまう背景があるのではないか」---

 似たような障害を繰り返しているのは,実はジャスダック証券取引所だけではない。インターネット上の検索サービスを使って「システム」「障害」「お詫び」などのキーワードで調べてみると,繰り返し障害を起こしている企業が予想以上に多い現実が見えてくる。

 なぜ障害を繰り返してしまうのか。どうすれば障害を繰り返さずに済むのか。その回答は,2005年にテスト不足が原因で情報漏洩(えい)を生じてしまったある開発会社の担当者の本音に隠されていた。

 「(情報漏洩したシステムは)当初の予定より機能数が1.5倍に膨れ上がり,要求が複雑化して,ユーザー企業の社内調整にも時間がかかった。要件定義や設計といった上流工程の遅れで,テスト時間を奪われた。テストの徹底は間違いなく必要だが,上流工程の遅れを何とかしないと,根本的な解決にはならない」

原因への対策では不十分

 「障害の原因を解消したい。だが,それを阻んだり,新たに原因を生み出したりする“課題”が現場に横たわっている」---。同様のニュアンスの言葉は,障害を経験した多くの現場担当者が口にしていた。

 クラッカによる攻撃で顧客情報を奪われたコンテンツ提供業者のシステム担当者は,「当時は攻撃に使われた手法の存在すら知らなかった。そのため,システム構築時にセキュリティ要件を盛り込まなかった。今回,対策機能をシステムに追加したが,次々に新しい攻撃手法が登場するので,とても追いきれない。不安でたまらない」と,スキル(知識)取得が追いつかない実情に悩みを見せる。

 冒頭で示したジャスダック証券取引所も,9月28日に発表した「原因と当取引所の措置について」という書面(当該文書--PDF形式--)で,次のように述べる。

 (8月29日の障害は)「取引参加者の接続数に関する設計値(「最大接続定義数」)を、JASDAQシステムの開発業者である(株)日立製作所が誤って修正したことが直接的な原因であります。・・・(中略)・・・このような障害が発生した原因には(株)日立製作所の修正ミスのみでなく、当取引所のシステム運営会社である(株)ジャスダック・システムソリューション(以下「JQSS」といいます。)における検証の不十分さや、当取引所及びJQSSの体制等についてもITガバナンスの徹底という観点から問題があったことは否定できません」

 こうした一連の声から見えてくることは,障害を繰り返さないためには,原因に対する対策を講じるだけでは不十分だということ。直接的な原因の背後に潜む“課題”を取り除くことが必要なのだ。

 ジャスダック証券取引所の例であれば,「ベンダー(8月の障害では日立製作所)の過信」という課題を解消しない限り,障害は繰り返される恐れがある。ジャスダック証券取引所が9月28日に打ち出した対策は,まさに「ベンダーの過信」を解消するための取り組みに他ならない。第三者による検証(2006年4月から),外部委託先の開発プロセス管理を強化(2005年11月から)・・・。これらの対策により,ジャスダック証券取引所は今後,経験済みの障害だけでなく,似たような障害の発生をも未然に防ごうとしている。

 2001年から3年間で障害発生件数を96%削減することに成功した東京海上日動システムズ 常務取締役 島田洋之氏の言葉も,現場が抱える課題までさかのぼった解決が必要であることを裏付ける。

 「表面的な原因や直接的な原因だけでなく,根本的な原因を突き詰め,背景となる外的要因や間接要因まで洗い出し,人の心に踏み込んで対策を打たないと,障害は減らない」