米Clouderaは米国時間2009年3月15日,分散処理プラットフォーム「Hadoop」の導入を支援するパッケージ「Cloudera's Distribution for Hadoop」を発表した。同社サイトから無償でダウンロードできる。Red Hat系Linuxと米Amazonの仮想サーバー・ホスティング・サービス「Amazon EC2」を利用する企業が,Hadoopを容易に導入/構成できる。
Hadoopは,米Apacheが開発するオープンソースの分散処理プラットフォーム。米Googleが開発したデータ処理モデル「MapReduce」を実装しており,大規模なデータを多数のマシンで並列処理できる。
ApacheはHadoopをtar.gz形式のアーカイブ・ファイルで公開しており,導入や構成の手間がかかるが,これを支援するのがClouderaの今回のパッケージとなる。RPM形式でパッケージをダウンロードし,CentOS 5やRed Hat Enterprise Linux 5などのRed Hat系Linuxに導入できる。また,同パッケージをAmazon EC2で利用するためのイメージ・ファイルも用意した。
同社サイト上の構成ウィザード「Cloudera's Configurator for Hadoop」では,利用する環境に合わせた構成ファイルを自動で作成できる。
同社はあわせて,Hadoopの導入と運用を支援する有償の商用サポートも提供する。