2006年9月,3日間にわたってつながりにくくなったNTT東日本の「ひかり電話」。加入電話と同じ対策が裏目に出て障害が長期化した。原因の特定作業も,障害の連続発生で大幅に遅れた。加入電話並みの品質をうたうひかり電話だが,運用レベルには課題が山積みなことが明らかになった。

 「着信規制を設定したサーバーにもふくそうが発生しました」。

 2006年9月19日の午前10時17分。ひかり電話のネットワークの運用担当者たちは大混乱に陥った。1時間ほど前に一部のサーバーで障害が発生。その障害の影響を限定する目的でほんの6分前に実施した着信規制が“あだ”となり,かえって被害を広げてしまったのだ。

 着信規制は,加入電話のふくそう対策としては常識的な措置。だが,今回のひかり電話では裏目に出た。不測の事態に混乱したNTT東日本は,その後の対応がすべて後手に回る。結果,発着信の規制が3日間も続く事態となった。

電話の“常識”が思わぬ副作用をもたらした

 2006年9月の障害の経緯を順に追うと,IP電話のトラブルにいかに対処すべきかというノウハウが,NTT東日本に不足していたことが分かる。

 最初の障害は,「ひかり電話ビジネスタイプ」向けの呼制御サーバーの1台で発生した(表1)。大口で回線を利用する企業が新たに契約し,9月19日に利用を開始。この企業あてに午前9時早々から通話が集中すると,呼制御サーバーがふくそうした。原因は一部のソフトウエアの不具合だった。

表1●2006年9月に発生した「ひかり電話」障害の経緯
表1●2006年9月に発生した「ひかり電話」障害の経緯
トラブルを赤字,対策を青字で示した。

 もっともこの時点では,通信障害の範囲は当該の呼制御サーバーだけ。NTT東日本は異常が発生したサーバーを直ちに特定すると,安定稼働させる処置を取った。

 具体的には,上位にある中継系呼制御サーバーから当該の呼制御サーバーあての着信を50%規制。着信の量を制限してサーバーの負荷を軽減させる狙いだった。「加入電話網で通話が集中した際には,着信規制をかけるとたいてい収まる」(NTT東日本の西勝ネットワーク事業推進本部研究開発センタ開発企画部長)。ごく常識的な対応を取ったはずだった。

 見込んだとおり,呼制御サーバーのふくそうは次第に収まった。だが,思わぬ副作用を生んだ。規制をかけた中継系呼制御サーバー自身がふくそうし始めたのだ。