「パブリッククラウドはまだ稼働して間がなく、どんな障害が起こるのかを予測できない。できる範囲の手当てをしておくべきだ」(クロス・マーケティング システム開発ユニット エグゼクティブマネージャー 永井秀幸氏)。

図5●信頼性の問題と現場の工夫
図5●信頼性の問題と現場の工夫

 まだ発展途上のクラウドの利用に取り組んだ現場を取材すると、信頼性に関しては、二つの問題が浮かび上がってきた(図5)。一つ目は、システムを冗長化して稼働率を高める際の問題である。多くのクラウドサービスはシステム構成がブラックボックスになっているため、冗長化に工夫が必要になった。稼働率を向上させたケースとして、インターネット上のコンテンツ流通を手掛けるライトアップや、ソーシャルゲームサービスのgumiの取り組みを取り上げる。対策はIaaSかPaaSかによって違ってくる。

 二つ目は、データをバックアップする際の問題である。データのバックアップを標準またはオプションのサービスとして提供するクラウド事業者は多い。しかし、人的ミスも含めてデータが消失する可能性はゼロではない。バックアップの手順や仕組みも多くの事業者が公開しておらず、どれだけの信頼性があるのかを判断しづらい。

 そこで信頼性を気にするユーザーは、クラウドの外部にデータをバックアップしていた。工夫が必要だったのは、障害発生直前のデータまでバックアップしたいときだった。PaaSを利用する場合、オンプレミスで利用できるRDBのレプリケーション機能などが使えない。この課題を解決したSBIモーゲージの工夫を紹介する。

 なおクラウドの稼働率などを事業者が“保証”するSLA(Service Level Agreement)はうのみにすると失敗する。その注意点を40ページの別掲記事に示した。

仮想マシンを別のサーバーで稼働

 IaaSにおいて稼働率を高める工夫は、システム内のどの構成要素を冗長化するかで違っていた。以下では仮想マシン(VM)、RDB、ロードバランサーという三つの構成要素を冗長化したケースを取り上げる。最初は仮想マシンを冗長化したライトアップの例だ。

 ライトアップはIaaSで仮想マシンを冗長化する際に、次の点が問題だと考えた。冗長化した仮想マシンが、異なる物理サーバーで動くとは限らないことである。ハードウエア障害によって、同じ物理サーバーで動く仮想マシンが全て停止する可能性があった。

 ライトアップは、写真画像やイラスト、動画などの販売や取引仲介を行う「コンテンツバンク」というサイトを2011年2月に立ち上げようとしている。取引仲介サイトとしての信用を保つため「ダウンタイムは数分以内に抑えたかった」(管理グループ兼経営企画室 マネージャー 中野徳康氏)。

 そこでライトアップの中野氏は、ビーコンエヌシーがIaaS「アドバンスドデータセンター」で用意するオプションサービスの利用を検討している。仮想マシンを別々の物理サーバーに稼働させられるサービスだ。「たとえ1台の物理サーバーがダウンしても、別サーバーの仮想マシンによって運転を続けられる」と中野氏は評価する。