写真1 障害を謝罪するNTT東日本の大木副社長ら幹部
写真1 障害を謝罪するNTT東日本の大木副社長ら幹部
[画像のクリックで拡大表示]
写真2 NTT東日本が作成した障害事象の説明
写真2 NTT東日本が作成した障害事象の説明
[画像のクリックで拡大表示]

 NTT東日本は5月16日、昨日夕方に発生し今日未明まで続いた大規模障害について会見を開いた。同社ネットワーク事業推進本部長の大木一夫副社長は「多大なる迷惑をかけて申し訳ありません。2度と起こさないように対策を進めたい」と謝罪(写真1)。設備部長らが技術面から説明した。

 問題の発端は東京・蔵前にあるNTT設備の1台のルーター。これが東京23区、神奈川、埼玉、千葉をのぞくNTT東の全エリアに波及した。具体的には、ルーターの部品故障が発生し、作業員が部品交換のため待機系のルーターに切り替えた。この結果、NTT東のフレッツを提供しているIPネットワークに構成の変更が発生。全4000台のルーターに対して、ルーティング情報を書き換えるように依頼が送られた。ここまでは通常の保守作業だった。

 ところが、この書き換えが大規模障害の主要因となった(写真2)。書き換えによってルーターの処理能力が限界を超え、IP網が広域でダウンしてしまった。NTT東が全エリアで問題を認識したのは15日午後6時44分。作業はその直前であり、障害は一瞬で全域に広がった。その後午後9時ごろから各エリアのルーターをリセットし、翌日午前1時30分に全面的に回復した。

 現在の対策としては、1台のルーターに設定するルーティング情報の数を1万5000から1万3000まで2000ルート減らすこと。これで負荷の軽減を図っている。また、障害の一因として、ルーターのソフトウエアがバージョンによって処理能力が低いという点がある。これを今後、処理能力が高い新バージョンに変更する。約半分の2000台が古いバージョンだという。東京23区、神奈川、埼玉、千葉ではルーターのソフトウエアを新バージョンで統一していたため、処理能力の不足は発生しなかったという。

 なお、今回の障害に伴うユーザーへの利用料金の返金は行わない。約款では24時間以上の停止を返金の条件としているからだ。