データウエアハウス(DWH)クラウドへの参入が相次いでいる。2012年11月には、米アマゾン・ウェブ・サービス(AWS)と独SAPがDWHクラウドを開始。米EMCと米ヴイエムウェアは12月、DWHクラウド参入への布石となる組織変更を発表した()。

表●主なデータウエアハウス(DWH)クラウド
[画像のクリックで拡大表示]

 DWHクラウドは、数百テラバイトを超えるようなビッグデータをクラウドに蓄積し、ユーザーがSQLなどを使ってデータを分析できるサービスである。

 AWSは11月、DWHクラウドの「Amazon Redshift」を発表した。AWSはRedshiftを始めるに当たって、DWHベンダーの米パラクセルから技術ライセンスを受けた。パラクセルは、リレーショナルデータベース(RDB)ソフトの「PostgreSQL」をMPP(超並列処理)のカラム型データストアに改良したソフトを販売するベンダーである。AWSのRedshiftも、パラクセル製品を使っていると見られる。

 SAPはDWH用途に使用できるインメモリーDB「SAP HANA」のクラウドサービス「SAP HANA One」を11月に開始した。インフラにAWSのIaaS(インフラストラクチャー・アズ・ア・サービス)を採用している。

 AWSとSAPのサービスの共通点は、既存のDWHソフトをクラウド化したことだ。既存のDWHソフトは、大量のメモリーやストレージを搭載したマシンが必要だ。AWSはDWHクラウドのために、メモリーを最大120ギガバイト、ハードディスクドライブを最大24個(16テラバイト)搭載する仮想マシンを用意した。

 DWHクラウドとしてはほかに、米グーグルが提供する「BigQuery」や、日本人の若手エンジニアが起業した米トレジャーデータが提供する「Treasure Data Cloud Data Warehousing」などがある。BigQueryはグーグルが開発した超並列クエリー処理ソフトである「Dremel」を、Treasure Dataは分散バッチ処理ソフトの「Hadoop」をベースにする。どちらもクラウド用に新規開発したものだが、SQLを使えるようにするなど、既存のDWHユーザーに配慮している。

 EMCとヴイエムウェアは2012年12月、EMCのDWHソフト「Greenplum」の部門と、ヴイエムウェアのPaaS(プラットフォーム・アズ・ア・サービス)「Cloud Foundry」の部門を統合し、両社から独立した部門にすると発表した。同部門は2013年に、PaaSのクラウドを開始する予定。クラウド部門とDWH部門を統合することで、DWHクラウドを提供する準備は整った。2013年にかけて、DWHクラウドの市場は、盛り上がりそうだ。