全日本空輸(ANA)が、5月末に発生したシステム障害の対策を今月中に完了することが分かった。障害は、旅客の予約・搭乗手続きや手荷物管理をする「チェックイン・システム」のうち国内部分で発生(関連記事)。約7万人の旅客に影響が及んだ。

 ANAはシステムを構成する、(1)メインのLANスイッチ、(2)チェックイン端末側のゲートウエイ装置、(3)ホスト側のゲートウエイ装置、の3つについて、短期的な対策を打った。当時は、2つのあるうち1系統のスイッチでメモリーが故障し、LANが不安定に。端末系ゲートウエイが能力不足に陥り、ホスト系ゲートウエイの障害対策が不十分だったため、さらに状況が悪化した。

 具体的な対策は、(1)はメモリー故障に自動対処できるソフトウエアの搭載、2系統のスイッチそれぞれの2重化、(2)は搭載するプロセサの増強、(3)は(2)で障害が発生した際に接続先を最適選択する機能の実装--である。(1)は8月、(2)は9月に対策を済ませており、(3)は10月中に対策を打つ。

 ANAはこうしたシステム障害の原因を抜本的に見直すため、外部のコンサルタントを交えたタスクフォースを設置し、9月まで約2カ月議論してきた。

 そこではIT運営の「組織」と、システムを含めた「ネットワーク」について中長期的な対策をまとめた。「組織」についてはシステム全体を統括して管理する組織の設立・運用、「ネットワーク」は全体最適での冗長構成の見直しや、システムが停止した際の対策強化といった事が挙げられた。ANAの経営陣には10月5日に報告されている。