米IBMは米国時間2011年5月20日、大規模データ解析に関する技術およびサービスの研究開発に1億ドルを投じる計画を明らかにするとともに、大規模データの高速処理を可能にする「Hadoop」ベースのソフトウエアや、大規模データの効率的な活用を支援する各種サービスを発表した。

 新たにリリースするソフトウエア「InfoSphere BigInsights」と「InfoSphere Streams」は、従来の構造化データに加え、テキストやビデオ、オーディオ、静止画像、ソーシャルメディア、クリックストリームを含む非構造化データも分析し、高速で処理することで、企業が迅速に意思決定を行えるようにする。

 BigInsightsは、オープンソースの分散処理フレームワークHadoopをベースにする。Hadoopは、米Googleの分散データ処理技術を参考にオープンソースとして開発されたもので、現在はApache Hadoopプロジェクトが開発を進めている。またStreamsは、大規模データを従来より最大350%速く分析する技術を備えているという。

 そのほか、20に及ぶ新サービスには、IT作業の特徴を分析し、最適なクラウド環境の導入プランを立てられるようにする「Cloud Workload Analysis」、10~20年のライフサイクルにおけるデータセンターの総コストや環境への影響を分析する「Data Center Lifecycle Cost Analysis Tool」などが含まれる。

[発表資料へ]