堅牢性を支える障害・性能管理技術

 NGNで最も重視されるべき「信頼性・堅牢性の強化」の基本は,ネットワークの状態を観察し,観察した結果を分析し,必要ならば対処するということである。さらには,その運用を効率化できるように,自動化・自律化できる範囲を拡大することである。最近,IP電話でのトラブルが数多く報じられており,その原因を迅速に特定する技術を求める声も高まっている。IPは基本的にエンド・ツー・エンドで固定されたコネクションを設定するわけではないため,その障害個所を切り分けること自体困難さを伴う。

障害個所を切り分ける各種技術

 図5は紛失パケットの前後のパケットの間隔に注目するパケット紛失個所の特定技術である。例えば高速回線でロスが生じた場合,低速回線に切り替わる際にバッファリングされるため,ロスで生まれたギャップは縮まる。従って,ロス前後のパケット間隔が縮まっていれば高速回線で,そうでなければ低速回線でロスが生じていると切り分けることができる。

図5●間隔分析によるパケット損失個所特定法
図5●間隔分析によるパケット損失個所特定法
網間に帯域差がある場合,2番のパケットがロスしたとき,ONUのバッファリングにより,1番と3番のパケット間隔が縮まる現象を検知することで,拠点内ロスであることを特定する。
[画像のクリックで拡大表示]

 図6は性能劣化個所を特定する技術である。一般に離れた企業の拠点間を結ぶ広域LANで性能障害が起こった場合に,拠点内LANに問題があるのか,広域ネットワークに問題があるのか,その切り分けに時間がかかることが多い。あるTCPセンッションに著しいスループット低下が見られたとき,広域ネットワークで並走する定常的なパケットの流れ,例えばルーティング・プロトコルの性能を観察し,問題のTCPセッションと同じような性能低下が見られれば,広域ネットワークに問題があることが分かる。

図6●ルーティング・プロトコル分析による障害個所分析法
図6●ルーティング・プロトコル分析による障害個所分析法
CEを起点とするプロトコル(ルーティング・プロトコルなど)の品質と拠点内端末を起点とするプロトコル(TCPなど)の品質を比較分析することにより,ネットワークの障害個所を特定する。
[画像のクリックで拡大表示]

 図7はIP電話の通話品質を管理する技術である。パケットの到着間隔を観測し,その揺らぎが大きくなる現象を捉えることで品質劣化をあらかじめ予測することが可能になる。ただし数多くのIP電話の全セッションのパケットの遅延揺らぎを観察することは現実的でない。図7の方法は,観察区間に試験パケットを挿入しその到着間隔の揺らぎを観察することで,リンク全体の性能を測り品質劣化を予測する。この試験パケットの注入の間隔をIP電話のパケット発生周期と異なるようにすることで,このリンク上のすべてのセッションの性能を測ることが可能になる。  以上は一部にすぎないが,このような障害・性能管理技術を導入したトランスポート管理により,堅牢で高信頼なNGNが実現できるようになる。

図7●IP電話の品質劣化予測技術
図7●IP電話の品質劣化予測技術
IP電話の送受信パターンを考慮したプローブ・パターンを使用することで正確な計測を実現。全キャプチャに比べて計測データ量を大幅に削減する。
[画像のクリックで拡大表示]

ネットワーク運用管理システムの実例

 ここでは運用管理システムの実例として富士通の光伝送網の運用管理システムAW-NaviとIPネットワークの運用管理システムProactnesを紹介し,NGNに向けた今後の展開を述べる。

 現状のネットワークは太い束を切り替え単位とする幹線系と,コネクションやパケットを切り替え単位とする交換系とで構成されている。前者をSDH(synchronous digital hierarchy)やWDM(wave length multiplexing)などの多重化技術を用いた光伝送網で構築し,その上に後者のIPベースパケット交換網を構築するのが典型的である。

 伝送ネットワークは,IPメディア以外にもレガシーの電話サービス,専用線サービス,放送サービスなど,様々な情報を太く束ねて運ぶため,安定性や高信頼性が一層要求される。例えば,冗長構成を採用し,装置に故障が発生しても,瞬時に装置やリンク・パスを切り替えることによりサービスへの影響を回避できるような「トランスペアレンシ」が求められる。運用管理システムもトランスペアレントな運用を支援するために,故障・障害発生を運用者に通知して運用への影響を判断させる機能を備えている。例えば,(1)障害・故障発生個所の判別,(2)修理の緊急性の判別,(3)修理回復の確認を支援する機能を持たせておく。図8に光伝送ネットワーク用のEMS(Element Management System)であるAW-Navi(ADM&WDM Navigator)のリンク故障発生の画面表示を示す。

図8●AW-Naviのリンク(セクション)故障の画面表示
図8●AW-Naviのリンク(セクション)故障の画面表示
[画像のクリックで拡大表示]

 一方,IPネットワークでは,情報発生源に相当するパソコンやサーバーが情報をパケット化してそれぞれのタイミングでネットワークへ送出するから,それらを集めたパケットの流れは一定ではなくバースト的になる。つまり,細かい時間間隔で観測すれば,トラフィック量が変動している。この変動の程度が小さければ機器の持つバッファによって吸収され流れが平滑化されるが,変動が大きいとバッファで吸収されずにパケットの損失が発生する。パケット損失は,TCPなどの端末間のプロトコルの再送処理により表に出ない場合もあるが,VoIPなどのリアルタイム情報の場合は,情報の欠落となるので,音声品質の劣化につながる。

 このような現象が起こりうるIPネットワークの運用管理システムには,ネットワークの状態を把握する機能が求められる。しかし,各ルーターが自律分散的にパケットを振り分けるネットワークにおいて,その状態を把握することは難しい。このため,半固定的なパスを設定するMPLSGMPLSの導入が進められている。写真1に当社のIPネットワーク系OSS(operation support system)であるProactnesのMPLSの経路表示画面を示す。画面にあるように,ネットワーク内のどこにどのようなLSP(label switched path)が設定されているか,それらがどのような状態かが視覚的に分かるようになっている。

写真1●LSPとサービス経路マップの画面
写真1●LSPとサービス経路マップの画面
[画像のクリックで拡大表示]

FCAPSに対応する管理機能が必要

 さて,NGNではIPと伝送ネットワークが一体になったトランスポート・ストラタムが構成されていく。従来のOSSは,障害管理が中心的な機能であったが,NGNでは,パスなどリソースの状態が動的に変化するので,運用者がネットワーク状態を正確に,迅速に把握できるような運用管理システムが求められる。つまり,NGN運用管理システムは,TMFでモデル化しているeTOM(enhanced telecom operations map)のリソース管理&オペレーションを実現できるように,前述したFCAPSと呼ばれる五つの管理機能すべてを用意しておく必要がある。図9に示すように富士通のProactnesは,IPネットワークにおけるeTOM準拠の機能を装備しており,必要に応じてNGN管理用機能の拡充を図っていく予定である。

図9●TMF-eTOMとProactnesの機能
図9●TMF-eTOMとProactnesの機能
[画像のクリックで拡大表示]

 また,AW-Naviは,GMPLSの管理システムとして,動的なリソース状態を管理する定期ディスカバリ機能,GMPLSが使用可能なリソースの割付機能,ネットワーク異常に対する強制制御機能を整えていく予定である。

 NGNは「IPベースの堅牢なネットワークの仕組みを基盤として,サーバー/アプリケーションなどサービス構成要素を仮想化し,さらに高度なサービスへと統合できるような情報サービス環境を提供する」ものである。その堅牢さを支えるのがトランスポート制御・管理機能である。今後,機能やサービスは高度に連携していき,管理する対象が複雑に絡み合うことになる。さらに,エンドユーザー数,サービス数も増加していくだろう。このような状況においても,使いやすく,しかも信頼がおけるネットワークを構築するためには,制御・管理システムが性能面でも進化していかなければならない。そのためには超分散管理,超高性能処理などの技術的ブレークスルーが必要になるだろう。

加藤 正文(かとう・まさふみ)
富士通研究所ネットワークシステム研究所
主管研究員
1981年,横浜国立大学工学部修士課程修了。同年富士通研究所入社。ネットワーク制御技術の研究開発に従事。2006年6月より現職。

森川 久(もりかわ・ひさし)
富士通ネットワークソリューション事業本部
ソリューション開発センター副センター長
1974年,東京理科大学理工学部卒業。同年富士通入社。伝送系,IP系のオペレーションシステム開発に従事。2006年7月より現職。