写真●NTTデータ セキスイシステムズの上野喜正氏(左)と積水化学工業の原和哉氏(右)
写真●NTTデータ セキスイシステムズの上野喜正氏(左)と積水化学工業の原和哉氏(右)

 積水化学工業は情報系システムのサーバー約50台を「big brother」を使って監視している。運用管理を担当するNTTデータ セキスイシステムズの上野喜正システム開発統括部第二開発グループ長は,「何より商用ツールに比べて導入コストを抑えられる。有名なツールなので情報が豊富にあるほか,ソースコードが公開されているので問題があれば自分で原因を調べられる」と採用の理由を話す。

 同社は情報系のインフラを自社開発する方針を持ち,そのベースとしてオープンソースを積極的に活用している。「ユーザーの要望に合わせて必要な機能を随時追加できるようにしたい。そのためにはできるだけ自社で開発する方がいい」(コーポレート情報システムグループの原和哉担当部長)という考えである。実際,WebサーバーはApache,データベース・サーバーはPostgreSQLを利用している。グループウエアはPerlによる独自開発だ。

 同じ考え方で,サーバーの監視にはbig brotherを採用した。big brotherはpingによるノード監視,HTTPやFTP,SMTP/POP3,DNS,Telnetなどのサービス監視の機能を備える。監視対象に専用エージェントをインストールすれば,サーバーのCPUやメモリー,ディスクの使用率なども監視できる。

 監視結果はWebブラウザを使って確認する。画面には監視対象と監視項目のマトリックスが表示され,アイコン(■マーク)の色で状況を把握できる。正常な場合は緑,障害時は赤,要注意なら橙で,個々のアイコンをクリックすれば監視結果の詳細を見ることが可能。また,画面全体の左端の色も,正常な場合は緑,1カ所でも障害が発生した場合は赤と変化し,状況が一目で分かるようになっている(図1)。

図1●big brotherの監視画面
図1●big brotherの監視画面
サーバーの死活状況をはじめ,CPUやメモリーの使用率,各サービスの動作状況などをWebブラウザから監視できる。写真は積水化学工業の利用例。 [画像のクリックで拡大表示]

 積水化学工業の場合,ノード監視やサービス監視に加え,各サーバーのトラフィック,マシンの温度,「vmstat」「iostat」「netstat」コマンドの実行結果,Apacheの負荷なども監視している。上野グループ長は,「障害が起こったときにbig brotherで全体の状況を即座に把握し,監視画面上で過去にさかのぼって原因を分析できるようにしたい。だから,取得できる情報はできるだけ監視対象に加え,記録に残している」という。定例の運用報告会などでのレポートに使うという目的もある。

 例えばCPUやメモリー,ディスクの使用率,トラフィックなどは,big brotherの拡張ソフトを利用し,値の変化をグラフ化して過去からの傾向を把握できるようにしてある。拡張ソフトには,MRTGと連携してトラフィック状況をグラフ化する「bbmrtg」,RRDtoolと連携してCPUやメモリー,ディスクの使用率などをグラフ化する「larrd」などを利用している。

URL:http://bb4.org/
ライセンス:フリー(非商用目的に限る)
動作OS:UNIX,Windows