2006年9月19日に発生した「ひかり電話」がつながらないというトラブルは,一応の解決まで7日間を要した。サーバーのトラブルにより,3日間,電話がつながらない,あるいはつながりにくいという被害をユーザーに与えたことはもちろん問題である。しかし,それ以上に,原因の詳細を特定するまでに7日間かかったという事実のほうが大きな問題である。今後,いろいろな方面に影響していくと見られる。ひかり電話,引いてはIP電話全体に対する「まだ不安定,ノウハウなど蓄積が少ない」という不信感を招いたからだ。この7日間の動きをまとめた。

「ひかり電話」がつながりにくい

 9月19日,9時ごろ,その兆候が表れた。NTT東日本が提供するIP電話サービス「ひかり電話」がつながりにくい状況になった。前日までが3連休であり,連休明けのため通話の集中したため,通話を制御したという。放っておくと,ひかり電話全体がダウンする恐れがあるからだ。NTT東日本が管轄する1都15県全域,契約回線数は8月末で約80万回線に影響が出た(関連記事)。

 ひかり電話は,同社のインターネット接続サービス「Bフレッツ」を使い,従来の加入電話と同等の機能を提供するNTT東日本のキラー・サービスともいえる。03-XXXX-XXXなどの0AB~J番号を利用でき,110番などの緊急通報も可能である。

 トラブル発見から約11時間後の19日20時ごろ,通話の集中が緩和されたということで「通話制御」を解除した。根本的な原因は調査中。

 ところが翌20日10時ごろ,再び,ひかり電話がつながりにくくなった。原因は,通話が集中したため,システムの再立ち上げを実施,そのための通話制御だという。その後,序々に通話制御を緩和し,20日22時30分ごろ,通話制御を解除した。この時点でも原因は調査中。

 
9月20日,記者会見で謝罪 

 この20日の夕方,NTT東日本は今回のトラブルについて記者会見を開いた(関連記事)。「19日と20日の障害は別もの」と説明した。19日は,法人向けの「ひかり電話ビジネスタイプ」の呼制御サーバーに負荷がかかり,不安定になった。この負荷を軽減するため,一般消費者向けのサービスも含めて通話制御を実施した。20日のトラブルは,一般電話網と接続する中継系呼制御サーバーに突然負荷がかかり動作が不安定になったという。その時点では「残念ながら,何が悪いのか,何が起こっているのかわからない」(NTT東日本)という状況であった。

 21日は,安定運用のため,通話制御を実施した(関連記事)。大きなトラブルが発生しないように,事前に通話量を制限,様子を見ながら緩和していくという対策である。同日,17時前に規制を解除した(関連記事)。ただし,まだ原因が不明であり,翌22日に通話制御するかどうかは未定であった。

22日に原因を一部特定

 22日は通話制御なしで安定稼働した(関連記事)。一方,トラブルの原因の一部を特定した(関連記事)。通話集中によって,なぜ呼制御サーバーに異常な負荷がかかったのかという根本的な原因である。原因は,呼制御サーバーの一部機能のソフトウエアにバグがあったこと。それがもとで呼制御サーバーが過負荷になり,それが中継系呼制御サーバーにも波及した。20日は,中継系呼制御サーバーが前日の不具合のため,初期状態に戻っていなくて本来の処理性能を発揮できなかったという。

 もちろん,サーバーの2重化など,冗長構成によって信頼性を高める仕掛けは用意している。しかし,同じバグのあるソフトウエアを搭載したサーバーに,処理を引き継いでも,同じ結果になってしまう(関連記事)。

 総務省が動き出した。22日,IPネットワークの信頼性を確保するための管理方法や技術基準を検討する「IPネットワーク設備委員会 安全・信頼性検討作業班」第1回会合を開催した(関連記事)。IP電話をはじめとするIP系サービスの障害が増え,障害の大規模化や長期化が進んでいることに対処するのが狙い。総務省が把握している分だけで,2005年度に70件の通信サービスの事故が発生しているという。最終的には省令などへの反映を目指している。

 
9月25日,NTT東日本の高部社長などが謝罪 
 25日,NTT東日本は,高部 豊彦社長などが記者会見を開いた。トラブルの原因の詳細と対策を説明した(関連記事)。19日は,ひかり電話ビジネスタイプ用の呼制御サーバーで,毎秒100コール以上の処理が可能な設計になっているはずだった。ところが,ソフトウエア・バグによって,10コール程度で遅延,過負荷が発生,電話がつながりにくくなった。20日は,各呼制御サーバーを束ねる中継系呼制御サーバーが19日にトラブルによるデータが残ったままになっており,それがトラブルを招いた。今後,復旧の手順などを充実させ,サーバーなどを増強していくという。

 併せて,ひかり電話ユーザーへの補償について発表した(関連記事)。ひかり電話の基本料3日分を減額するというもの。

 今回のひかり電話のトラブルは,IP電話に対するマイナス・イメージを残した。しかし,現行のアナログ電話網やINSネットでも,とくにサービス開始当初にトラブルは発生している。トラブルは許されるものではないが,最初から100%万全でサービス開始というのは難しいということを気に留めておきたい。IP電話ネットワークの高機能版ともいえる次世代ネットワーク「NGN(Next Generation Network)」でも,当初はリスク・ヘッジを検討したほうがいいだろう。