ITpro Special ITpro
富士通SystemwalkerでIT全般統制を支援! キャパシティ管理によるITシステムの維持最適化
Vol.2:問題の早期切り分けにより、迅速な課題解決を実現

前回は、確実なITガバナンスを実現するために必須の「キャパシティ管理」を実現する富士通の「Systemwalker Service Quality Coordinator」の概要を紹介し、これを利用することによって課題をいち早く察知し、トラブルを未然に防いだ事例を解説した。今回はトラブルの早期発見・課題解決事例を挙げつつ、「Systemwalker Service Quality Coordinator」の強力なレポート機能を紹介していこう。


【事例】レポート機能で、問題を特定
富士通株式会社 ソフトウェア事業本部 ミドルウェア事業統括部 第二ミドルウェア技術部 プロジェクト課長 堀江 隆一氏.

 製造業A社には、スタッフ部門の数千人が経費精算や購買などに利用している事務システムがある。このシステムを安定的に稼働させるため、「Systemwalker Service Quality Coordinator」を活用してキャパシティ管理を実行。日頃からCPU稼働率やメモリ使用量などの監視をしていた。すると、5,000人を超える利用者があった日が月数回あり、3台のWeb/APサーバで、CPU負荷の急増による性能劣化を観測した。

 そこで、まず「Systemwalker Service Quality Coordinator」のレポート機能で、1ヶ月のCPU負荷状況(図1)を確認したところ、70%を超える高負荷率の発生日が3日あった。次に、日と時刻の関係(図2)から、毎回朝9時頃にピークが発生していることがわかった。なお、この3日は月初およびA社の交通費精算の締め日であった。

図1 図2

 Webシステムの性質上、基本的にはCPU負荷はトラフィック量(パケット量)と比例する傾向がある。そこで、対象日時のCPU負荷とトラフィックを比較(図3)。さらに両者の相関関係を確認(図4)したところ、相関関係から外れた日時が3点あり、いずれもCPU負荷が70%を超えた日時であった。これは、トラフィックとは無関係にCPU負荷が増加したことを示している。従って、これらの日時ではトラフィック量増加とは異なる何らかの要因でCPU負荷が増加していることがわかった。

図3 図4

 富士通の統合運用管理ソフトウェア「Systemwalker」を担当する、富士通 ソフトウェア事業本部 ミドルウェア事業統括部第二ミドルウェア技術部 プロジェクト課長 堀江隆一氏は「Systemwalker Service Quality Coordinatorは、さまざまな角度からログを分析でき、わかりやすいグラフとしてレポーティングができるので、問題の特定が容易です。このレポートは、日々のキャパシティ管理に利用できるだけでなく、システム増強の必要性を経営陣などに理解してもらうための資料としても、非常に使いやすいものです」と語っている。

1,200種にもおよぶ「Systemwalker Service Quality Coordinator」の多彩なレポート機能


トラブルの切り分けと問題箇所の特定も容易に

 A社の例を「Systemwalker Service Quality Coordinator」のドリルダウン機能で分析したところ、対象の日時におけるCPU使用率の内訳(ユーザープロセス、システムプロセス)から(図5)、ユーザープロセスの使用が多く、さらに、プロセス別のCPU使用時間を確認すると(図6)Javaの負荷が高まっていることが判明した。

図5 図6

 また、トラフィック増加とは無関係にCPU負荷が増加していたことから、JavaのGC(ガベージコレクション)回数を確認したところ(図7)、9時にはGCが最大1分間に400回、58秒間も発生していることを確認。念のため、CPU負荷とGC回数との関係も確認したところ(図8)、両者に相関関係があり、GCの増加がCPU負荷を増加させていたことが判明した。

図7 図8

 堀江氏は、「Systemwalker Service Quality Coordinatorを使って詳細情報の確認(ドリルダウン)を行うことで、問題箇所の特定が容易になります。今回の場合は利用するまでもありませんでしたが、どのサーバに問題があるかを特定するには、トランザクションの内訳分析機能が非常に有効です。Webサーバ、APサーバ、DBサーバそれぞれの稼働状況を可視化できるので、どこにボトルネックがあるのかが一目瞭然になるのです」と語る。

「Systemwalker Service Quality Coordinator」の基準値比較による分析

最適投資で安定稼働を実現

 原因と特定されたGCの発生回数を減らすため、8個だったJavaプロセスを16個に増加させた。すると、前月に70%を超える高負荷が発生した日時と同程度のトラフィックの発生時においてもCPU負荷を50%以下に抑えることができた(図9)。さらに、従来1台のサーバで500ユーザーしか利用できなかったところが1,000ユーザーまで利用可能になった。これにより、コストをかけずに、3台で計1,500ユーザー分の性能増強を実現した。

 堀江氏は、「今回のケースでは、『Systemwalker Service Quality Coordinator』による詳細な分析により、コストをかけずに従来の2倍の性能増強が可能になりました。いつもここまで劇的に改善するとは限りませんが、詳細な問題の切り分けを行うことで、適正なコストで確実なパフォーマンスの改善が望めます」と語っている。

 その他にも、「Systemwalker Service Quality Coordinator」では、処理時間やCPU使用率をもとにリソースの将来的な使用傾向を予測する回帰分析や、サービス品質とリソースの関係性を分析する相関分析レポートが用意されている。
これにより処理量の増加傾向をつかめるほか、リソース配分の最適化やコスト削減につなげることができる。

「Systemwalker Service Quality Coordinator」による分析と予測に基づく投資の最適化

 ここまで2つの事例で見てきたように、キャパシティ管理を実現する「Systemwalker Service Quality Coordinator」を利用することで、システムダウンを未然に防ぎ、迅速な問題の特定と対応が可能になる。事業継続を確実なものとするためにも、ぜひキャパシティ管理に取り組んで欲しい。

News!
SystemwalkerによるIT全般統制特集 特集サイトはこちら
内部統制は整備から運用のフェーズへ! IT全般統制対応に万全な運用管理の秘訣〜今こそ求められる統合運用管理・ジョブ管理〜
ITproについて会員登録・メールマガジン購読ITproプレミアム(有料サービス)MyITproについてITpro Researchについて
ITproへのお問い合わせ・ご意見日経BP書店日経BPケータイメニュー広告について
著作権リンクについて|個人情報保護方針/ネットにおける情報収集/個人情報の共同利用についてサイトマップ

日経BP社Copyright (C) 1995-2010 Nikkei Business Publications, Inc. All rights reserved.
このページに掲載されている記事・写真・図表などの無断転載を禁じます。著作権は日経BP社,またはその情報提供者に帰属します。
掲載している情報は,記事執筆時点のものです。