ひかり電話のトラブルについて説明するNTT東日本の高部豊彦代表取締役社長
ひかり電話のトラブルについて説明するNTT東日本の高部豊彦代表取締役社長
[画像のクリックで拡大表示]

 NTT東日本は9月25日,19日から21日まで続いたひかり電話のトラブル原因を特定し,報告した。

 同社によれば今回大きく二つの部分で不具合があった。一つはひかり電話ビジネスタイプ用の呼制御サーバー。毎秒100コール以上を処理できる設計になっていたが,実装のミスによりある機能を使っているユーザーでは10コール程度で遅延が発生。輻輳(ふくそう)がおこり,つながりにくくなった。

 具体的には,「複数ゲートウエイスリップ機能」の実装に問題があった。複数ゲートウエイスリップ機能とは,アナログ回線用のPBX装置にIP網とのゲートウエイ装置を複数接続し,あるゲートウエイ装置につながる回線がすべて話中の場合,残りのゲートウエイに順番に切り替えていくもの。ひかり電話ビジネスタイプのうち,約30のユーザーがこの機能を使っていたが,19日に新規利用を初めたユーザーに多くの呼が集まり,不具合が表面化した。23日にソフトウエアの不具合部分を修正し,現在は毎秒100コール程度の処理をこなせるようになったという。

 もう一つは各呼制御サーバーを束ねる中継系呼制御サーバーの不具合。ビジネスタイプ用の呼制御サーバーで輻輳が頻繁に起こった結果,サーバーのメモリー上にデータが溜まり,処理領域を圧迫。中継系呼制御サーバーで所定の性能が発揮できず,輻輳が生じたという。「19日の輻輳でメモリー上にゴミが堆積。19日にはアプリケーションを再起動したが,OSを再起動しなかったためゴミが残ったままになってしまった」。この結果,20日も輻輳が起こったという。そこで,20日午後にOSごと中継系呼制御サーバーの再起動を実施。メモリーからゴミが消えたため,現在は正常に稼働しているという。

 今後の対策として同社は,「復旧の手順や負荷分散機能の充実,サーバー/ネットワークの増強などあらゆる手段で通信の信頼性向上をしていく」(同社の高部豊彦社長)とした。