UFJIS オープンプラットフォーム部長 末廣修司氏
UFJIS オープンプラットフォーム部長 末廣修司氏
[画像のクリックで拡大表示]
UFJISは三菱東京UFJフィナンシャル・グループに提供している総合金融プラットフォームの標準構成
UFJISは三菱東京UFJフィナンシャル・グループに提供している総合金融プラットフォームの標準構成
[画像のクリックで拡大表示]
UFJISが検証で発見,修正した問題の例。ext3ファイル・システムなどLinuxのブロック・デバイスを利用する際,同期画込みであっても,実際のディスクではなくバッファへの書き込み完了時に完了応答してしまっていた
UFJISが検証で発見,修正した問題の例。ext3ファイル・システムなどLinuxのブロック・デバイスを利用する際,同期画込みであっても,実際のディスクではなくバッファへの書き込み完了時に完了応答してしまっていた
[画像のクリックで拡大表示]

 「徹底した試験を行い,見つかった障害に対してはカーネルの修正パッチを作成して適用したこともあった」----UFJIS オープンプラットフォーム部長 末廣修司氏は11月7日,日経Linuxが主催した事例研究セミナー(関連記事)で,三菱東京UFJフィナンシャル・グループで利用しているLinuxサーバーの信頼性強化策を語った。

 UFJISは三菱東京UFJフィナンシャル・グループにITプラットフォームを提供しており,70近いシステムが,約200ノードのLinuxで稼働している。2003年の情報系システムでの導入を皮切りに,2004年1月の銀行内勘定系システム,2005年7月のダイレクトバンキング・システムなどをカットオーバーさせてきた。

 銀行の基幹システムに耐えうる信頼性を確保するため,同社では様々な手を打っている。まずブレード・サーバーによる冗長性の確保。サーバーに障害が発生した場合,別のサーバーが処理を引き継げるようになっている。

 また,2005年に日立製作所およびVAリナックスと契約,障害発生時のメモリーダンプ取得や,Linuxソースコードでの障害解析や修正パッチの提供といった信頼性強化サービスを利用している。

 検証は高い負荷のもとで長時間運転を行うなど徹底して行った。その際に発見された問題を解決していった。

 例えばRed Hat Enterprise Linux 3では,大量I/O発生時にLow Kernel Memoryの枯渇などによりOSが不安定になり,無応答になったり突然リブートしたりした現象が発生した。この問題に対しては,Maximum Transfer Unitサイズのチューニングを行った。ifconfigコマンドを使用して1.5Kバイトに設定した。またカーネルをUpdate1からUpdate4にバージョン・アップした。

 またRed Hat Enterprise Linux 3 Update4/5では,メモリー・アクセス時の排他制御の不具合により,システム・クラッシュやデータ破壊を引き起こす場合があった。物理アドレスと仮想アドレスの変換テーブル(PTE)を更新する際,別々のタスクが同時にPTEを参照した場合,誤ったメモリー・アドレスにデータを書き込む可能性があるというものだ。

 この問題に対しては応急措置としてメモリー利用率を4Gバイト以下に抑えるとともに,日立製作所が作成したパッチを適用した。このパッチはRed Hat Enterprise Linux Update5 SecurityUpdate1以降で取り込まれたという。

 もうひとつの例としては,ext3ファイル・システムなどLinuxのブロック・デバイスを利用する際,同期画込みであっても,実際のディスクではなくバッファへの書き込み完了時に完了応答する仕様であることが問題になったケースがあった。この問題に対しては,メーカーがディスク装置とあわせて個別パッチを提供した。

 末廣氏は,Linuxの課題として「メモリー・ダンプ機能はLinuxディストリビューションではなく,カーネルが標準で備え機能を向上させるべき」,「プロセッサやメモリーに障害が発生した際に稼働中に切り離せる機能を実装すべき」,「システムやユーザー・アプリケーションごとにリソース使用の優先制御の実現を」と指摘する。しかし「メインフレームやUNIXも登場時には不完全であり,技術はユーザーの活用により改良されていくだろう」との期待を表明した。