今回も前回に引き続き,グリッドのエンタープライズ・コンピューティング,すなわち,オンライン・トランザクション処理やデータウエアハウスなどへの適用上の課題について考えて見よう。

◆課題3:データ量の課題

 エンタープライズ・コンピューティングの世界では数テラ・バイト以上の膨大なデータを扱わなければならないことが通常である。グリッドにより遠隔地で処理を行わせることは容易であっても,それに伴うデータまでもネットワークを介して転送することは,性能的に厳しいことが多い。かと言って,遠隔地からデータをアクセスさせれば前回述べたレイテンシ(遅延)の問題が生じることになる。

 科学技術計算では,大量のデータが必要でないことも多いし,仮に必要な場合であっても,解こうとしている問題自体に並列性があるため,データとそのデータに対する処理をまとめて数多くに分割できることも多い(いわゆる,データ・パラレルと呼ばれる処理形態である)。一方,一般的に言えば,エンタープライズ・コンピューティングで扱うデータを細かく分割することは困難である。頻繁に更新される共用データの一貫性を維持することが難しくなるからである。

◆課題4:信頼性の課題

 言うまでもないことだが,データや処理を分散し遠隔地に置くことで信頼性は大きく低下する。特に,データ・センター環境にないマシン上で処理を行っている場合には,突然の遮断があってもしかたないと考えるべきだろう。

 科学技術計算であれば,途中で障害を起こした処理は結果を破棄して最初からやり直せば済むような構造であることが多い。これに対して,エンタープライズ・コンピューティングの世界では,時々刻々と更新されるデータの整合性を常に維持していなければならない。更新途中のデータを単純に破棄してやり直すというわけにはいかないことが多い。

◆課題5:その他の課題

 さらに,セキュリティ,課金などの課題についても,エンタープライズ・コンピューティングにおける要件は科学技術計算における要件よりもはるかに厳しい。

 今まで述べたきた課題のうち,課題4と課題5は,まさにGlobusツールキット(連載第3回参照)などのグリッドの基盤ソフトウエアが解決しようとしている課題であり,比較的短期間に解決策が提供されるだろう。しかし,課題3と前回述べた課題1「並列性の課題」と課題2「レイテンシの課題」は,アプリケーションに内在する本質的な課題であり,その解決には技術的なブレーク・スルーとアプリケーションの再設計を要するだろう。

◆エンタープライズでは使える分野がある

 グリッドによるエンタープライズ・コンピューティングについてかなり否定的であるかのように思われるかもしれないが,そういうわけでもない。「エンタープライズ・コンピューティング」(基幹系トランザクション処理)におけるグリッドの適用は困難だが,「エンタープライズ」(企業)におけるグリッドの適用は十分現実的と考えている。

 グリッドによる価格性能比に優れた科学技術計算のメリットを享受できるのは,学術機関や企業の研究開発部門だけではない。実際,金融工学におけるディリバティブの分析処理などをグリッド上で実現することで,ビジネスの世界でグリッドの大きなメリットを達成できたケースも出てきている。

 この他にも,データ・マイニングなど,ビジネスの世界でグリッドが効果を発揮できるケースは多そうである。グリッドによる科学技術計算の市場は,従来型のスパコン市場を置き換えるだけではなく,新たなアプリケーション分野を創生するという形でも進んでいくだろう。

 また,将来的にグリッドの世界でエンタープライズ・コンピューティングが実用化されることになっても,それは,インターネットを介した広域分散型の処理ではなく,ひとつの企業内の比較的少数のサーバを緊密に連携させて使用したり,従来型の大型サーバを利用して集中型で処理された結果をWebサービスにより企業間で連携するというような形になっていくだろう。

 「これはグリッドではなく,クラスタやB to Bではないか。」と思われる方もいるであろう。筆者もこのような処理形態をグリッドと呼んでしまうのには若干の抵抗がある。どのような言葉が最終的に市民権を得るのかを予測するのは難しいが,“バーチャル・データセンター”とでも呼んだ方が適切ではないかと思っている(あくまでも感覚的な話ではあるが)。

 さて,次回はグリッドの最終回として主要ベンダーのグリッド戦略についてまとめてみる予定である。