2009年5月12日午前10時30分ごろに発生した東京工業品取引所のシステムダウンは、待機系のルーターが過負荷状態に陥ったことが引き金だった(関連記事1関連記事2関連記事3)。待機系の異常が本番系に伝播してシステムダウンにつながった。東工取が5月13日に記者会見を開き、明らかにした。

 東工取は取引システムと取引参加者をつなぐネットワーク上に合計4台のルーターを設置している。2台が本番系で残る2台が待機系だ。本番系の2台は並行稼働しており、取引参加者との通信データを分散処理している。

 まず2台の待機系のうち1台の利用率が100%近くに達した。次に、この待機系と二重化構成を組む本番系の利用率が100%近くに上昇。2台の本番系のうち1台がダウンした。この結果、ダウンした本番系ルーターにつながる取引参加者が取引システムと通信できなくなった。ルーターの利用率は、通常状態では数%程度という。

 本番系に異常が発生した影響で待機系も動かなくなるトラブルは少なくない。だが、待機系の異常が本番系に影響を及ぼすのは珍しい。待機系のルーターの利用率が100%近くに上昇した理由と、待機系の異常が本番系に伝播した経緯は「引き続き調査中」(東工取の福井裕一執行役)という。

 東工取によると、取引システムの構築とルーターの設定・導入を担当したNTTデータが調査したが、根本的な原因を突き止められなかったという。現在はルーターの製造元であるシスコにログデータの解析を依頼している。東工取は5月13日の午後11時以降、夜間取引の終了後に引き金となった待機系のルーターを交換する。

 トラブルは5月12日の10時30分ごろに発生。 東工取は11時35分に全商品の取引を停止した。その後、原因究明のために過負荷状態に陥ったルータを再起動するなどして様子を見た。その結果、ルーターの過負荷状態が解消し正常な状態に戻ったため、午後2時10分に取引の再開を決定。2時30分から注文受付を開始し、3時に取引を再開した。3時30分に日中の取引を終了した後、5時からは通常どおり夜間取引を開始した。

 東工取は5月7日にスウェーデンのOMXテクノロジー製パッケージソフトを採用した新しい注文処理システムを稼働させている(関連記事4)。この注文処理システムには異常は見つかっていないようだ。トラブルが起こったルーターは、新システムの稼働に先駆け2月9日から稼働させており、この日までは正常に動作していたという。