図1●仮想サーバーにおける運用の問題
図1●仮想サーバーにおける運用の問題
仮想サーバーを本格的に運用すると,仮想化ならではの問題に直面する。この特集では,主要な四つの問題とその解決方法を取り上げる
[画像のクリックで拡大表示]

 「サーバー仮想化の運用は,従来の物理環境とは勝手が違う。試行錯誤の連続だ」。こう話すのは,人材派遣などを手がけるウィルホールディングス(ウィルHD)の橋場元敬氏(情報システム室 室長)である。同社は米VMwareの仮想化スイート「VMware Infrastructure 3」を使い,経費精算やSFA(Sales Force Automation)など社内システム用の仮想マシン26台を物理サーバー4台に集約して稼働させている。

 特に腐心しているのは,仮想マシン同士をどのように組み合わせて各物理サーバーに配置し直せば処理負荷を平準化できるのか,という再配置のやり方だ。「これまで経験したことがない作業なので,一から考え工夫している」と橋場氏は言う。

 ウィルHDと同じく仮想サーバー(ここでは仮想化した物理サーバーの意味)の本格運用に入った現場の多くは,仮想化ならではの運用の問題に直面している。取材を通して,「仮想マシンの再配置」「障害発生時の調査」「バックアップ」「セキュリティ」に関する四つの問題が浮かび上がった(図1)。以降で,これら四つの問題について,その詳細と解決策を見ていく。

[1]仮想マシンの再配置---コツは大まかな分類

 仮想サーバーにおいて監視すべきリソースには,主要なものだけでも,CPU,メモリー,ディスクI/O,ネットワークI/Oの四つがある。仮想環境における物理サーバーのリソース使用率を平準化しようとすると,そこで稼働する多数の仮想マシンにおいて,これら四つのリソースの使用率を考えなければならない。具体的には,各仮想マシンのリソース使用率を物理サーバーごとに足し合わせ,ピークが一定値を超えないように配慮しながら,物理サーバー間でリソース使用率が均等になるように仮想マシンを再配置する必要がある。リソース使用率は時々刻々と変化するので,極めて複雑な最適化問題を解くことに等しい。

 そのため現状では,物理サーバーの台数に余裕を持たせ,再配置をしなくても済むように各仮想マシンに潤沢なリソースを割り当てるケースが多く見られる。とはいえ「仮想化によるサーバー統合のコスト・メリットを追求するなら,再配置は避けて通れない」(ウィルHDの橋場氏)。

 現場で行われている再配置のアプローチは大きく二つある。一つはリソース使用率の平準化の問題を単純にした上で,人間が考える方法。もう一つは,ツールで自動化する方法である。

処理負荷で3段階に分類する

 人間が考える方法として,ウィルHDのやり方を紹介しよう(図2)。コツは平準化の問題を単純にするため仮想マシンを大まかに分類することである。

図2●再配置の考え方の例
図2●再配置の考え方の例
ウィルホールディングスは,仮想マシンをCPUの処理負荷の高さで3段階に分けた上で,特に高負荷のものに着目して分散配置し,物理サーバー間のリソース使用率を平準化している
[画像のクリックで拡大表示]

 いきなり先述の四つのリソース使用率をすべて考慮しようとすると,問題が複雑になり過ぎる。そこでウィルHDの橋場氏は,CPUの使用率のみに着目し,大まかに,高負荷,中負荷,低負荷という3段階に分類することにした。このうち最も重要なのは高負荷の分類だという。特に,処理負荷が突出して高い3台の仮想マシンを高負荷に分類し,異なる物理サーバーに配置した。

 次に橋場氏は,中負荷と低負荷の仮想マシンを各物理サーバーに振り分けた。その際,月末,月曜日,夜間といった仮想マシンの処理負荷のピークが,同一の物理サーバーで重ならないように気を配った。26台ある各仮想マシンの処理負荷のピークは,経験的に分かっていたという。

 その上で日々,仮想マシンごとの四つのリソース使用率を監視しながら,低負荷(場合によっては中負荷)のものを再配置して,物理サーバー間のリソース使用率のバランスを取っている。

 橋場氏によると,1日当たり1人時の工数を割いてリソース監視を行い,随時,再配置をしているという。ただし仮想マシンが100台を超える規模になると,このやり方では難しいかもしれない。そこでもう一つの例として,現在約130台の仮想マシンを運用している富士フイルムのやり方を紹介する。