企業が情報システムの障害を防ごうと思って対応しても、次から次へと問題が発生し、まるで“逃げ水”のように解決への道が遠のいていく――。全日本空輸やNTTで5月下旬以降に相次いで起こった情報システムの大規模トラブルは、IT(情報技術)の複雑性と人力の限界が抱える問題の根深さを浮き彫りにした。

全体つかめぬガラス細工

 障害が起きたのは、全日空国内線の予約・発券・搭乗手続き業務を処理する大型コンピューターシステムと、NTTの通信・通話サービスであり、一見すると両者に共通点はなさそうだ。だが、実は障害を起こした直接のきっかけも、解決が難しい根本的な要因も同じと言ってもいい。

 直接のきっかけは、通信関連機器の交換作業だ。全日空では大型コンピューターと操作端末の接続を担うシステム機器の一部を交換、NTT東日本は通信サービス「Bフレッツ」などを支える4000台のルーター(経路制御装置)のうち1台だけ部品を交換したら、システム全体にトラブルが波及した。IP電話の「ひかり電話」でも交換作業にミスがあり、東西のNTTの間で通話が不通になった。

 一部の交換だけで、なぜシステム全体が止まってしまうのか。根本的な原因は、システムの複雑化が進みすぎた点にある。全日空も、NTTも、多種類のコンピューターを組み合わせて1つの大きなシステムを構成している。様々なソフトウエアが搭載され、それらが互いにデータをやり取りしているため、一部の機器の不具合が全体に波及するリスクが常につきまとう。例えて言えば、現在の情報システムは、複雑な形状をしたガラス細工のようなものである。

 では、システムをより注意深く、ベテランが中心になり修理・交換すればいいのか。事はそう簡単ではない。

 まず、採用するハードウエアやソフトウエアごとに開発したメーカーが異なることが多く、全体の設計などを見渡せる技術者が事実上存在しない。このため、どのような経緯で全体に影響が及んだのか、障害の原因をきちんと特定しにくく、早期に再発防止策を施すことも容易ではない。全日空も詳細な原因究明に懸命だ。

 NTTのフレッツやひかり電話の基盤となっているルーター・ネットワークはインターネット技術を利用しており、各ルーターが自律して動く分散型のシステムになっている。これが交換機を使った従来のシステムに比べて通話コストの低減につながっているわけだが、中央からコントロールしづらい仕組みであるため、ベテランでも障害原因を特定しにくくなってしまった。

人手不足で刷新も難しく

 しかも、企業はそのベテランすらも引退してしまう「2007年問題」に直面しており、中堅・若手技術者へ複雑極まりないノウハウを継承することは至難の業だ。そこでガラス細工のような複雑なシステムを大幅に刷新しようと考えても、空前の人手不足に悩む情報システム会社はそう簡単に引き受けられない。システム各社は「豊作貧乏」が続いており、そもそもコスト面などでユーザー企業の要望に応えられる状況ではない。

 ITの2007年問題は技術の継承に加え、人知を超えて複雑化が進むシステムの問題や、システム構築全般の人手不足などが次々と追い打ちをかける深刻なレベルに達しているのである。

 残念ながら現在、この逃げ水のような構造問題への特効薬はない。情報システムの大規模障害が今後も発生する可能性は十分ある。企業は、障害が発生してもその影響を最小限にとどめて事業を継続できる計画を立てておくべきであり、一般の利用者も大きなシステムトラブルが起こるリスクを頭の片隅に入れておく必要がある。

(谷島 宣之=「経営とIT」サイト編集長)


本稿は、日経ビジネス2007年6月4日号13ページからの転載です。

【情報システム事故関連記事】

  • 総論・技術者だけでは防げない
  • 「ひかり電話」はまだまだ止まる
  • 東証システム問題を考える(前編) IT広報の強化が喫緊課題
  • 東証システム問題を考える(後編) システム力強化と競争原理の導入が再生の道
  • CIOは「情報事故」を防げるか
  • みずほ銀行システム障害に見る「動かないコンピュータ」の根本原因