「サーバーが一瞬でも止まったら,1分単位で利用料金を返還します」。そんな“SLA(Service Level Agreement)100%保証”をうたうホスティング・サービスが6月下旬に登場する。NTTコミュニケーションズとEDSジャパンが共同で提供する「AGILIT(アジリット)」である。

 AGILITの“新しさ”は,ネットワークやサーバーの障害発生を検知した瞬間から,1分単位で料金を返還する点にある(実際には,翌月の利用料金を割り引く)。

 これまでも,障害停止時の復旧時間をSLA保証で規定しているホスティングやハウジングのサービスはあった。しかし,従来のSLA保証では,短時間のサービス停止を料金返還の対象外にしていた。例えば,IIJのネットワーク・サービスでは,1回の連続した利用不能時間が30分を超えない限り,料金は返還されない。ケーブル・アンド・ワイヤレスIDCも,10分未満の故障復旧は補償対象外である。このため,障害が起きても,実際に料金が返還されることは少なかった。

「一瞬でも補償対象に」

図1●AGILITは障害時に1分単位で料金を返還する“SLA 100%保証”をうたう
障害を検知してから1分単位で料金を返還(翌月の利用料金を割り引く)。クラスタ構成のサーバーの場合,15分を過ぎても障害が復旧しないと,段階的に返還率を引き上げる。補償の上限は月額料金まで。図示した復旧時間と月額料金の関係はイメージ
表1●自動構成技術でSLA保証の拡充を図るホスティング・サービスの例

 AGILITには,このような例外規定はない。契約したサービス品質を満たせなければ,必ず料金返還を保証するため,“SLA 100%保証”をうたう。「障害を皆無にすることは現実には無理だが,サービス品質に責任を持つ意気込みを示した」(NTTコミュニケーションズ ITマネジメントサービス事業部 サービス開発部長 与沢和紀氏)。

 例えばサーバー管理サービスの場合,障害停止を検知した瞬間から,1分単位で返還料金を計算し始める(図1[拡大表示])。ユーザー企業は,障害時間に相当する料金を,必ず返還してもらえる。さらに,復旧保証時間である15分(クラスタ構成時)を超えると,超過分の返還率は段階的に引き上げられる。障害が長期化したときにユーザー企業の被害を最小限に食い止めるためだ。補償の上限は月額料金の範囲内である。

 このようなSLA 100%保証の先駆者は1999年に提供を開始した米Loudcloudである。実はAGILITのサービス内容は,「Loudcloudをほぼそのまま踏襲したものだ」(与沢氏)。

 Loudcloudのホスティング部門は米EDSが買収した(買収で残った部門が米Opsware)。NTTコミュニケーションズは2003年3月にEDSと業務提携。日本法人であるEDSジャパンを交えてサービス提供の準備を進めてきた。例えば,ユーザー企業への導入コンサルティング,設計・構築支援,導入検証をEDSジャパンが受け持ち,導入後の保守・運用をNTTコミュニケーションズが担当する。

自動構成技術で作業を迅速化

 障害時に迅速にサービスを復旧するために,Loudcloudのサービスで使われていた運用自動化ソフト「Opsware Platform 4.0.1J」を採用した(別掲記事を参照)。システムの“自動構成技術”を搭載したソフトだ。例えば,サーバーが故障したときに,予備機にOS/ミドルウエア/アプリケーションをインストールして代替機を構成し,システムに組み込むといった作業が自動化できる。実施する作業内容をポリシー定義として準備しておくことで,多岐にわたる運用作業を自動化し,素早く実施できるようになる。

 さらに,このソフトにNTTコミュニケーションズのサービス・インフラを組み合わせることで,復旧作業の初動を迅速化した。障害検知後,数秒間で根本原因を自動分析し,ユーザー企業と保守要員にメールなどで通知する。

 NTTコミュニケーションズは今後,運用作業の自動化を推し進め,SLA保証のメニューを予見的な性能保証まで拡充する。例えば,サーバーのCPU使用率がしきい値を超えたら,応答時間が遅れる恐れがあるため,一定時間内にサーバー機を増設する――というSLA保証を提供する予定だ。

 自動構成技術を活かしてSLA保証の拡充を目指すのは,AGILITだけではない(表1[拡大表示])。大手サービス事業者を中心に,動きがある。2004年末には,サービスの選択肢が増えそうだ。

複雑化するシステムを自動化技術で救う

 米Netscape Communicationsの共同設立者で,現在はデータセンターの運用自動化ソフトを開発する米OpswareでChairmanを務めているMarc Andreessen氏に話を聞いた――。

 いまや多くの企業が,保守/運用費,セキュリティ管理,品質維持に課題を抱えている。その一因になっているのは,実はWebシステムの普及だ。

 Webシステムでは,性能を向上させるために,複数のサーバー機を並べて負荷分散するスケールアウト構成を採ることが多い。そのため,企業はより多くのサーバー機を保有することになった。

 管理すべきサーバー数が増加するにつれ,保守と運用の費用は上がる。ある調査結果では,企業は技術予算の75%を保守と運用に割いているという。例えば,1週間に1本の割合で提供されるセキュリティ修正プログラムに対処するといった作業に忙殺されているのだ。修正プログラムの導入でトラブルが生じないかを検証し,必要に応じてアプリケーションを変更し,サーバーの設定を見直す。導入した修正プログラムを取り除かなければならないこともある。

 こうした一連の処理を人間が手作業で実施する限り,必ずミスが生じ得る。障害の温床になり,システム品質が低下する。

 我々Opswareは,この悪循環を絶つべく,運用自動化ソフトである「Opsware Platform」を開発した。4年間のデータセンター運用で培われた技術とノウハウの結晶だ。

 2004年3月には,日本のハードウエアやソフトウエアをサポートした「日本語版」を出荷した。画面やメッセージの日本語化も,6月には完了する。日本で製品を販売するNECや,製品を使ったホスティング・サービスを提供するNTTコミュニケーションズと協力しながら,日本企業のシステム運用環境を改善していきたい。(談)


(実森 仁志=hjitsumo@nikkeibp.co.jp)