LANスイッチネットワークで起こる問題の主たる要因の一つとして、レイヤー2(L2)ループ構成がある。今回は、LANスイッチによるネットワークで陥りやすく大きな通信障害となり得る、ネットワーク設計の時点でのループ構成に対する十分な検討の必要性と、その対策の重要性について述べる。

 ネットワーク担当者なら、ループ構成によりブロードキャストストームが発生し、業務通信がすべて停止してしまったという事故を、耳にしたことや体験したことがあるだろう。しかしその対策の重要性と、対策を取ったネットワーク構築の必要性を十分に理解している人はどれだけいるだろう。

業務処理さえ止めるループ

 A社のサーバールームには、業務で使うグループウエアやWebポータル・サイトなどのために、いくつものサーバーが設置されている。ここに新規業務用のサーバーとそれを接続するためのLANスイッチを追加導入した(図1上)。LANスイッチには既存のサーバーを接続しているのと同じ機種を選択し、レイヤー3(L3)スイッチに接続するよう工事業者に依頼した。

図1●小さな接続ミスが大きなダメージを与える<br>A社は新設した業務サーバーがダウンを繰り返した(上)。原因はループ構成によりブロードキャストストームができていたためだった(下)。
図1●小さな接続ミスが大きなダメージを与える
A社は新設した業務サーバーがダウンを繰り返した(上)。原因はループ構成によりブロードキャストストームができていたためだった(下)。
[画像のクリックで拡大表示]

 接続がすべて終わり、確認のため新規業務サーバーにアクセスしたが、接続がうまくいかない。サーバーを確認すると起動していたはずの業務プロセスが停止していた。業務アプリを正常に起動させても、しばらくするとまた応答が返ってこなくなる。サーバーを確認すると、プロセスが停止していた。ネットワークから切り離した状態だと正常な動作を続けるため、問題個所の疑いはネットワークに向けられた。

 ネットワークを調査すると、LANスイッチのポートのLEDが激しく点滅していた。このLEDは通信中に点滅することから、ブロードキャストストームが発生していると推測できた。

 新規導入部分を中心に調べてみると、工事業者が誤って、L3スイッチと新規導入したL2スイッチを2本のLANケーブルで接続していたことが分かった(図1下)。この個所がループ構成となって、L3スイッチとL2スイッチの間にブロードキャストストームが生じてしまったのだ。これにより、トラフィック量が増大し、新規導入したサーバーの業務プロセスがダウン。業務サービスが数時間停止してしまった。

 ループ構成が引き起こす通信障害(ループ障害)はいくつかある。ブロードキャストストームによる通信帯域の圧迫、トラフィック増大によるルーターなどのネットワーク機器やサーバーの過負荷、LANスイッチのMACアドレス学習異常などだ。

 A社の場合は、サーバーの動作が不安定なことに着目してサーバー側の調査から始めたため、解決まで時間を要した。ブロードキャストストームが起こっていることは確認できても、どの個所がループ構成となっているのかを特定するのが困難な点も、ループ障害のやっかいな特徴の一つである。