図1●一般的なHadoop利用環境
図1●一般的なHadoop利用環境
[画像のクリックで拡大表示]
図2●Interstage Big Data Parallel Processing Serverの構成
図2●Interstage Big Data Parallel Processing Serverの構成
[画像のクリックで拡大表示]

 富士通は2012年2月27日、ビッグデータ活用に向けたパッケージ製品「Interstage Big Data Parallel Processing Server V1.0」を販売開始した。4月末から提供する。オープンソースの分散処理ソフト「Apache Hadoop」を組み込んだバッチ処理基盤であり、「独自の分散ファイルシステムを採用して、性能と信頼性を高めた」(クラウドプラットフォーム開発本部の芳賀豊 DI技術開発室長)。

 Hadoopで一般に使われるHDFS(Hadoop Distributed File System)の代わりに、独自の分散ファイルシステムを使用。マスターサーバーからスレーブサーバーに対して効率的にジョブを割り当てることなどで、「HDFSに比べて5~10倍のI/O性能を実現した」(芳賀室長)。

 Hadoop利用環境のアーキテクチャーを工夫することで、処理性能や使い勝手も高めた。

 既存システムのデータをHadoopで分析する場合、一般に(1)分散データのアップロード、(2)Hadoopで処理、(3)処理結果のダウンロード、という手順を踏む(図1)。これに対してInterstage Big Data Parallel Processing Serverは、共有ファイルを介して、既存システムとHadoopを連携させる(図2)。データのアップロードとダウンロードが不要になり、処理時間が短縮できる。分散ファイル上のHadoopの処理結果に対しては、POSIXインタフェースを介して、既存システムのアプリケーションからアクセス可能だ。

 Hadoopの最新版とHiveやPig、HBaseといった周辺のオープンソースソフトを富士通が組み合わせ検証した上で提供。「スマートセットアップ」と呼ぶインストーラーにより、短時間で容易に導入できるという。価格はプロセッサライセンスで60万円から。導入時の構成設計やインストールを行う「初期導入サービス」(個別見積もり)、問題解決支援や最新版提供などを行う「サポート(SupportDesk)」(年額12万円から)を用意する。

 Interstage Big Data Parallel Processing Serverの提供に先立ち、Hadoop単体のサポートサービスを2月末に開始する。導入時の「SupportDesk OSSサポート(Hadoop初期導入サービス)」と、それに続く運用支援の「SupportDesk OSSサポート(Hadoopサポートサービス)」で、どちらも個別見積もりである。