インフォテリアは2012年12月26日、2013年1月に出荷するシステム連携ソフトの新版「ASTERIA WARP 4.7」において、「Amazon Elastic MapReduce」(Amazon EMR)とのデータ連携機能を追加すると発表した。ASTERIAのデータ処理業務の中で、クラウド型の分散バッチ処理基盤を活用できるようになる。価格(税別)は、ASTERIA WARP本体が480万円から。

 前提となるASTERIA WARPは、異なるシステム同士をデータ連携させるためのEAIソフトである。各種のアダプターを介して業務ソフトやデータベースなどのデータソースに接続し、これらのデータをルールに基づいて変換し、外部システムに引き渡す。ジョブフローを定義/実行するバッチスケジューラとしての機能も備える。データ処理や外部プログラム起動といったプロセスを条件に合わせて駆動できる。

 次期版では、Amazon EMRと連携するためのアダプターを追加する。これにより、ASTERIA WARPのジョブフローにクラウド型の分散バッチ処理を組み込めるようになる。具体的には、ASTERIA WARPのデータソース/データ出力先としてAmazon S3ストレージを利用できるようになるほか、ASTERIA WARPで制御するジョブの一つとしてAmazon EMR上で動作する分散バッチ処理アプリケーションを利用できるようになる。

 連携対象のAmazon EMRとは、Apache Hadoopをベースとしたクラスター(並列サーバー群)を時間課金で提供するクラウドサービスである。仮想サーバーを提供するAmazon EC2と、永続ストレージサービスのAmazon S3を組み合わせ、これらインフラ基盤の上で、HadoopやHadoopアプリケーションの開発/実行基盤などを提供する。数十台といった大規模なサーバークラスターを、簡単な操作で一時的に利用できる。

 インフォテリアでは、Amazon EMRとのデータ連携の実証実験として、ノーチラス・テクノロジーズの分散バッチ処理フレームワーク「Asakusa Framework」で開発したHadoopアプリケーションとの連携を確認したという。バッチ処理の対象データをAmazon S3に格納し、Amazon EMR上で動作させたAsakusa Frameworkアプリケーションをリモート起動してデータを処理させた。

 なお、今回実証実験で利用したAsakusa Frameworkとは、バッチ処理を簡単にHadoopで実行できるようにするフレームワーク(開発/実行ツール)である。バッチ処理用のDSL(目的別の上位言語)で記述したソースコードを元に、MapReduce処理を実施するJavaコードを自動生成し、ランタイムを含んだJARファイルを生成する。