前回は、確実なITガバナンスを実現するために必須の「キャパシティ管理」を実現する富士通の「Systemwalker Service Quality Coordinator」の概要を紹介し、これを利用することによって課題をいち早く察知し、トラブルを未然に防いだ事例を解説した。今回はトラブルの早期発見・課題解決事例を挙げつつ、「Systemwalker Service Quality Coordinator」の強力なレポート機能を紹介していこう。
製造業A社には、スタッフ部門の数千人が経費精算や購買などに利用している事務システムがある。このシステムを安定的に稼働させるため、「Systemwalker Service Quality Coordinator」を活用してキャパシティ管理を実行。日頃からCPU稼働率やメモリ使用量などの監視をしていた。すると、5,000人を超える利用者があった日が月数回あり、3台のWeb/APサーバで、CPU負荷の急増による性能劣化を観測した。
そこで、まず「Systemwalker Service Quality Coordinator」のレポート機能で、1ヶ月のCPU負荷状況(図1)を確認したところ、70%を超える高負荷率の発生日が3日あった。次に、日と時刻の関係(図2)から、毎回朝9時頃にピークが発生していることがわかった。なお、この3日は月初およびA社の交通費精算の締め日であった。
富士通の統合運用管理ソフトウェア「Systemwalker」を担当する、富士通 ソフトウェア事業本部 ミドルウェア事業統括部第二ミドルウェア技術部 プロジェクト課長 堀江隆一氏は「Systemwalker Service Quality Coordinatorは、さまざまな角度からログを分析でき、わかりやすいグラフとしてレポーティングができるので、問題の特定が容易です。このレポートは、日々のキャパシティ管理に利用できるだけでなく、システム増強の必要性を経営陣などに理解してもらうための資料としても、非常に使いやすいものです」と語っている。
A社の例を「Systemwalker Service Quality Coordinator」のドリルダウン機能で分析したところ、対象の日時におけるCPU使用率の内訳(ユーザープロセス、システムプロセス)から(図5)、ユーザープロセスの使用が多く、さらに、プロセス別のCPU使用時間を確認すると(図6)Javaの負荷が高まっていることが判明した。
堀江氏は、「Systemwalker Service Quality Coordinatorを使って詳細情報の確認(ドリルダウン)を行うことで、問題箇所の特定が容易になります。今回の場合は利用するまでもありませんでしたが、どのサーバに問題があるかを特定するには、トランザクションの内訳分析機能が非常に有効です。Webサーバ、APサーバ、DBサーバそれぞれの稼働状況を可視化できるので、どこにボトルネックがあるのかが一目瞭然になるのです」と語る。
堀江氏は、「今回のケースでは、『Systemwalker Service Quality Coordinator』による詳細な分析により、コストをかけずに従来の2倍の性能増強が可能になりました。いつもここまで劇的に改善するとは限りませんが、詳細な問題の切り分けを行うことで、適正なコストで確実なパフォーマンスの改善が望めます」と語っている。
その他にも、「Systemwalker Service Quality Coordinator」では、処理時間やCPU使用率をもとにリソースの将来的な使用傾向を予測する回帰分析や、サービス品質とリソースの関係性を分析する相関分析レポートが用意されている。
これにより処理量の増加傾向をつかめるほか、リソース配分の最適化やコスト削減につなげることができる。
ここまで2つの事例で見てきたように、キャパシティ管理を実現する「Systemwalker Service Quality Coordinator」を利用することで、システムダウンを未然に防ぎ、迅速な問題の特定と対応が可能になる。事業継続を確実なものとするためにも、ぜひキャパシティ管理に取り組んで欲しい。
Copyright (C) 1995-2009 Nikkei Business Publications, Inc. All rights reserved. このページに掲載されている記事・写真・図表などの無断転載を禁じます。著作権は日経BP社,またはその情報提供者に帰属します。 掲載している情報は,記事執筆時点のものです。