NTT西日本は10月24日午後4時,10月23日午前9時35分から断続的に続いている障害について,状況と対策を公表した。

 今回の障害のきっかけになったのは「呼処理サーバー」と呼ばれるサーバー。具体的には電話番号から,どの呼制御サーバーに接続するのかを判定する役割を担っている。ひかり電話のサーバーは大きく一般+オフィスタイプ用とビジネスタイプ用に分かれており,呼処理サーバーも両タイプ用に一つずつある。このうち一般+オフィスタイプ用呼処理サーバーに呼が集中してふくそう状態に陥った。

 その後(23日午前10時8分),呼処理サーバーをリセットしたものの,状況は改善せず,加入者系の呼制御サーバーや中継系の呼制御サーバーからの呼処理サーバーへの接続を制限した。その結果中継系の呼制御サーバーでもふくそうが発生して,ひかり電話全般がつながりにくい状態になった。23日午後8時46分には中継系サーバーにシステム・リセットをかけ,一時的に状況は改善したが,24日朝からはまた前日と同じふくそう状態に入り,中継系サーバーおよび呼処理サーバーへの接続制限を再開した。

 解決策としては,25日朝までに呼処理サーバーを増設して処理能力を上げる。その後,システムをチェックしながら徐々に接続制限を弱めていく。

 呼処理サーバーがふくそうした原因については,現状のところ呼が集中したという以上のことは不明。今後詳しく分析することになる。

 9月に発生したNTT東日本のひかり電話障害はビジネスタイプの呼制御サーバーのバグが発端であり,原因は別である。しかし障害を起こしたサーバーへの接続制限が,広い範囲を担当する中継系サーバーのふくそうにつながって障害が長期化した点は共通している。今後,障害を広げないためのシステム運用がNTT西日本には強く求められる。