2009年10月30日、東京証券取引所の株式売買システムでトラブルが発生し、一部銘柄の終値が決まらず東証株価指数(TOPIX)の算出が遅れた(関連記事)。その19日前の10月11日には、ニュージーランド航空の基幹システムがダウンしてチェックインシステムおよび予約システム、コールセンターのシステムが使えなくなった。

 ニュージーランド航空のシステムはほとんどが1時間以内に復旧したが、海外メディアの報道によれば窓口業務が正常な状態に戻るまでには6時間かかり、日本を含む世界中の顧客1万人以上が影響を受けたという。

 ニュージーランド航空のシステム障害の3日前にあたる10月8日、地方競馬の馬券をインターネットや携帯電話などで販売する企業、オッズパークのシステムで、利用者から購入注文を受け付けたにもかかわらずそれらのデータを競馬の主催者に送れず馬券が無効になるトラブルがあった。

 同社の携帯サイトでは7日前の10月1日にも、利用者が販売サイトにログインすると別の会員の個人情報が表示されるトラブルが起こっている。さらにさかのぼること15日前の9月16日には、福岡銀行のオンラインシステムが全面ダウンしてATM(現金自動預け払い機)が数時間にわたり使えなくなった。一部の振り込み処理が遅れる影響も生じた。

進みにくい障害事例の共有

 なぜかは分からないが、9月から11月にかけては、毎年のようにシステム障害が目に付く。過去数年をさかのぼると、航空関連のシステム、鉄道の制御システム、自動改札システム、証券会社や証券取引所のシステム、IP電話の通信網など、社会インフラと呼べるシステムの大規模トラブルが起こっている。

 当たり前ではあるが、正常に動作していたシステムが突然に異常をきたしたのには、必ずきっかけとなった原因がある。原因としてよくあるのは、ソフトウエアの不具合、作業ミス、運用ミス、機器の故障、電源トラブルなどである。原因は一つとは限らない。ある異常が原因となって別の異常を引き起こすといった具合に複数の異常が連鎖するケースもある。

 これらの原因を突き止め、その対策を講じることが、システム障害の再発を防ぐ基本である。とはいえ、あるシステム障害の再発防止策を講じても、また別の原因でシステム障害が起こる可能性は十分にある。

 できることなら、システム障害が起こる前に、システム障害の原因となり得る異常を検知したいところだ。そのために有効なのが、他社のシステム障害事例を検証することである。

 ところが、この他社の事例を検証する作業がなかなか難しい。システム障害を引き起こした企業が、必ずしも事象とその原因を公開するとは限らないからだ。本来なら、システム障害の発生経緯や原因について、企業の枠組みを超えて蓄積・共有していくことが望ましい。だが、残念ながら現状ではこのような情報共有の仕組みが整備されていない。

システム障害が最も起こりやすい季節は?

 もちろん、なかにはシステム障害事例の公開に積極的な企業もある。最たる例が福岡銀行と東京証券取引所だ。特に福岡銀行は、システム障害の発生経緯とその原因、再発防止策について詳細に公表している。システム障害そのものの責任についてはさておき、このような情報公開の姿勢は評価できる。だが残念ながらシステム障害の情報公開に積極的な企業は極めて少ない。

 集めにくい障害事例の共有を進めるために、日経コンピュータはセミナーを企画した。11月18日に開催する「いまこそ運用改革!実例に学ぶトラブル撲滅・コスト削減策」だ。

 セミナーでは、システム障害を繰り返し金融庁から業務改善命令を3度受けた楽天証券のCIO(最高情報責任者)が登壇する。楽天証券もシステム障害情報の公開に積極的な数少ない企業の一社である。システム障害に直面した当事者の生の声を直接聞くことができる数少ない機会として、ご活用いただければと思う。

 先ほど、システム障害の情報を共有する仕組みが整備されていないと書いたが、実は少しずつではあるが、情報共有の動きが出てきている。日本情報システム・ユーザー協会(JUAS)と情報処理推進機構(IPA)、経済産業省が協力して進める「重要インフラ情報システム」の信頼性向上に向けた取り組みだ。重要インフラ情報システムとは、銀行のオンラインシステムや証券取引所のシステム、交通機関のシステムなど社会インフラシステムを指す。

 11月18日の日経コンピュータ・セミナーでは、この活動の中核であるJUASの「重要インフラ情報システムの高信頼性対策調査プロジェクト」の座長を務める東京情報大学環境情報学科客員教授の玉置彰宏氏を招き、これまでの研究の成果やシステム障害の傾向と対策などについて明らかにしてもらう。

 システム障害対策では、コストとの兼ね合いも無視できない。そこで新日本石油のシステム関連会社、新日石インフォテクノでシステム運用改革を推進する責任者の方にも登壇いただき、システムの信頼性向上と運用コストの大幅な削減を両立した具体的な取り組みについて披露してもらう。

 日経コンピュータは8月19日号で過去のシステム障害の傾向を分析した記事を掲載した(関連記事)が、本セミナーでは、この特集に掲載しなかった調査データもいくつか紹介する。例えば、冒頭に述べた「秋にシステム障害が多い」という仮説を検証するため、日経コンピュータが過去に誌面で取り上げたシステム障害を発生月別に集計した結果を公開する。日経コンピュータの連載記事「動かないコンピュータ」などで取り上げたシステム障害事例について、障害のあったシステムの構築・運用を担当していたIT企業を調べ、IT企業別に障害件数を数えた結果も明らかにする。

 システム障害についての議論を深めるために、ぜひともご参加いただければ幸いである。