EMCジャパンとノーチラス・テクノロジーズは2012年1月19日、分散バッチ処理ソフト「Hadoop」を基幹系システムのバッチ処理に適用するソリューションで協業すると発表した。EMC版のHadoopディストリビューション「Greenplum HD Enterprise Edition(EE)」と、ノーチラスのアプリケーションフレームワーク「Asakusa Framework」を組み合わせて提供する。

 EMCは同日、Greenplum HD EEの日本市場での販売を開始した。Greenplum HD EEは、Apacheソフトウエア財団のオープンソースソフトウエア(OSS)である「Apache Hadoop」をベースに、性能や可用性などを強化したディストリビューションだ。分散ファイルシステムとして、標準の「HDFS」ではなく、米MapRテクノロジーズが開発した「MapR FS」を採用。C/C++で実装したMapR FSは、Javaで実装したHDFSと比べて高性能であり、Greenplum HD EEはApache Hadoopと比べて、2~5倍の高速化が見込めるとしている。

 耐障害性や拡張性も強化した。Greenplum HD EEは、クラスターの管理ノードである「Name Node」や、Hadoopの並列プログラミングモデル「MapReduce」のジョブを管理する「JobTracker」を多重化/分散配置している。Apache Hadoopでは、これら管理ノードが単一障害点となっていた。

 またGreenplum HD EEは、システム管理機能も強化した。MapR FSは、業界標準の「NFS」によるファイルアクセスが可能であり、独自API経由でアクセスする必要があるHDFSと比べて、他システムとのデータのやりとりが容易だ。MapR FSに保存したデータに関しては、スナップショットの作成も可能で、オペレーションミスなどによるデータの誤削除などにも備えやすい。

 Greenplum HD EEは、Apache Hadoopと互換性があり、大量データの分析など一般的なHadoopの用途に使用できる。今回、EMCがノーチラスと提携したのは、日本市場ではHadoopの需要として、大量データの分析以外に、基幹系バッチ処理があると判断したため。ノーチラスの「Asakusa Framework」は、Hadoopを基幹バッチ処理を行うためのフレームワーク。ノーチラスではHadoopを基幹系に適用するに当たって、Greenplum HD EEの耐障害性を評価した。「これまでHadoopで基幹系を運用する場合は、Hadoopクラスター全体がダウンすることに備えて、クラスターを2系統用意していた。Greenplum HD EEであれば、単一のクラスターだけで基幹系を運用できると考えている」(ノーチラス・テクノロジーズの神林飛志副社長)。

 Greenplum HD EEやAsakusa Frameworkは、アクセンチュア、伊藤忠テクノソリューションズ、オージス総研、新日鉄ソリューションズ、大和総研、TIS、東京エレクトロンデバイスといったパートナー経由で販売する。販売はサブスクリプション形式で、1ノード当たりの年間ソフトウエア利用料金という形式で課金する。価格は個別見積もりで、「10ノードで、500万~600万円程度になる」(EMCジャパンの仲田聰データ・コンピューティング事業本部テクノロジー&プロフェッショナルサービス部長)としている。