夜間バッチの遅れが解消されず、さらにATMの全面ダウンも引き起こしたことから、みずほ銀は3月18日、抜本的な障害対応に乗り出すことを決めた。

 障害対応にシステムのリソースを集中するため、18日から22日にかけて、店舗外ATMやインターネットバンキングなどの停止を決めた()。さらに3連休の間はすべてのATMを止めることにした。

図●みずほ銀行のシステム構成と、トラブルが波及した箇所
図●みずほ銀行のシステム構成と、トラブルが波及した箇所
表●みずほ銀行30の不手際
表●みずほ銀行30の不手際
本文中の太字にそれぞれ対応する
[画像のクリックで拡大表示]

 18日午後1時30分、みずほ銀本店ビル22階に、障害対策チームのオペレーションルームを設けた。そこに、みずほ銀のIT・システム統括部とシステム運用部、みずほ情報総研、システム運用を担うみずほオペレーションサービスの担当者が集まった。障害発生から5日後にようやく、3社の障害対策チームが一本化した表-28)。

 これに前後して、手動で行っていた夜間バッチを効率化するため、TARGETを改良し、処理を自動化できるようにもした。

 18日からの巻き返しによって、19日午後7時5分に15日分の夜間バッチが完了した。それでも夜間バッチの遅延は依然深刻で、22日朝までに夜間バッチを解消できない恐れが高まった。そこで21日にはSTEPSを改良して、昼間のオンラインと夜間バッチを並行処理する準備を進めた。

 TARGETやSTEPSの改良といったシステム上の手当が遅れたのは、システムの基本構造や処理方式などを熟知するシステム要員が決定的に不足していた表-29)のと、みずほ情報総研などの子会社で、銀行実務を知る要員が減少していたためである。

 22日からは、昼間のオンライン中に、21日分までの夜間バッチも並行処理し始めた。これが奏功し、22日分の夜間バッチから、通常の自動運行が回復した。すべての遅れが解消したのは24日、トラブル発生から10日後のことだ。

 みずほ銀が設置した「システム障害特別調査委員会」が5月20日に発表した「調査報告書」を読み解くと、経営陣のシステム障害に対する判断が後手に回っていたことが分かる。