写真●日経SYSTEMSの中山 秀夫記者
写真●日経SYSTEMSの中山 秀夫記者
[画像のクリックで拡大表示]

 東京ビッグサイトで開催中の「ITpro EXPO 2009」会場で,日経SYSTEMSの中山秀夫記者は「サーバーを仮想化すると,管理する物理サーバーの数が減るので運用は楽になると言われる。だが,現実はそううまくはいかない」と講演し,ユーザー取材で分かった4つの問題点とその対策を示した。

 第1の問題は,物理サーバーの負荷を平準化するための仮想化マシンの再配置をどうするかである。「多くの仮想マシンを1台の物理サーバーに詰め込めばコスト削減効果は大きい。しかしリソースの余裕が小さくなり,ちょっとした負荷のピークにも耐えられなくなる」(中山記者)。

 二つめは,障害発生時の原因切り分けの難しさ。「仮想マシンがどの物理サーバーで動作しているのかが把握にくいので,影響範囲がすぐに特定できない」(同)。

 三つめはバックアップ処理の実行方法である。「物理サーバーの場合と同様に,エージェント・ソフトを仮想マシンに置く方式をとると,1台の物理サーバーに複数台の仮想サーバーがあるため,ネットワークI/Oへの負荷が大きくなる」(同)という。

 四つめは,セキュリティ管理だ。「1台の仮想マシンがウイルスに感染したりクラッキングを受けたりしたら,同じ物理サーバーの他の仮想マシンにも波及するのではないかという不安がある。また,管理サーバーを乗っ取られると,すべての仮想マシンが無防備な状態になってしまうことを心配するユーザーも多い」(同)。

先行企業の取り組みから分かった対策法

 次に中山記者は,ユーザー取材から分かった四つの落とし穴への対策を,実例を交えて披露した。仮想サーバーで監視すべき主なリソースは,CPU,メモリー,ディスクI/O,ネットワークI/Oの四つである。サーバー再配置は本来,これらの使用状況を監視しながら,物理サーバーの負荷が平準化されるように仮想マシンを移動させる。この最適化作業は非常に複雑で,現実にはここまでやるのは難しい。どのユーザーも最適化問題を単純化する工夫をしている。

 ウィルホールディングスは,物理サーバー4台と比較的小規模な仮想サーバー・システムを運用していて,最も影響の大きいCPU負荷だけを考慮する,という割り切りで最適化問題を単純化した。

 CPU負荷の大きさによって,仮想マシンを3種類に分け,高負荷,中負荷の仮想マシンが偏らないよう,物理サーバーに分散配置した。低負荷の仮想マシンを物理サーバーの負荷に応じて配置することにより,微調整している。同社では毎日のようにサーバーの再配置作業をしているが,ほとんどの場合,実際に動かすのは低負荷の仮想マシンだけという。「このやり方が通用するのは,小規模システムだけ。数十台以上になると難しい」と同社の担当者は語っている。

 富士フイルムの例では,再配置の頻度を日次から月次に減らした。さらに,ピーク時に着目して1日の時間帯をいくつかに分類し,ピーク時間帯が重ならないように,仮想マシンを物理サーバーに分散配置した。この方法は,ある程度リソースに余裕がある場合に可能だという。

 中山記者が補足として挙げたのは,自動化ツールの採用である。導入している企業はまだ多くないが,「自動化ツールについては,まだ試してもいないという企業が多く,食わず嫌いの感がある。バンダイナムコゲームスのように自動化した先例もあるので,一度ぐらい試す価値はあるのではないか」と述べた。

 二つめの問題である障害発生時の調査については,「手間暇を惜しまないのであれば,構成管理をきっちりするのが王道」としたうえで,仮想化システム向けの運用支援ツールを紹介。「トポロジーを一覧できる米AkoliのBalancePointなど,日進月歩で進化している分野。色々探して試してほしい」と語った。

 三つめのバックアップについては,負荷の大きなエージェントを使う方法に代えて,ディスク装置が備えるコピー機能でスナップ・ショットを取得し,それをバックアップ用の記憶装置にコピーする「ハードウエア方式」や,VMware Consolidated Backup (VCB)などの仮想化環境向けバックアップ・ソフトを使ってSANディスクにバックアップを作成する方法を紹介した。

 四つめのセキュリティについては,管理サーバーの乗っ取り対策として,管理サーバーと配下の仮想マシンでネットワーク・セグメントを分ける方法を挙げた。仮想マシン間のウイルス感染などについては,仮想マシン間のパケットを仮想IPS(侵入防止システム)でフィルタリングする方法が有効だという。

事前に利用を義務付けるべき

 中山記者は最後に,あるEC企業でのサーバー仮想化を巡るエピソードを披露した。物理サーバー300台の大規模システムを構築したが,CPU利用率は30%と余裕があるにもかかわらず,なかなか利用部門が使ってくれないという。

 その理由は,商品検索機能を高速化するため,高価なディスク装置を導入したことで利用部門に請求する課金額が割高になってしまったことにあった。パフォーマンスが要求されるECサイトの機能などでは利用されても,部門のファイル・サーバーなどで使うには高すぎたのだという。

 この例から得た教訓として,中山記者は「全部門に仮想化環境の利用を義務付けておくこと」を挙げた。「全社レベルでの最適化が,部門に最適とは限らない。コストがからんでくると,後からいくら利用をお願いしても受けいれてもらえない。複数のユーザーがこの点を強調していた」という。