2011年から急速に、脚光を浴びてきた「ビッグデータ」。この言葉の意味は非常に広く、事例によってデータの種類や活用目的も様々だ。そして同市場に参入しているベンダーの動きも、決して一様ではない。

どんなデータや業務領域に重点を置くのか

 例えばデータの種類に関して、ガートナー ジャパンでビッグデータ関連の動向調査を行っている堀内秀明マネージング バイス プレジデントは、以下のように整理することで、その難易度と必要性が理解しやすくなるのではないかと主張している。

(1)…社内の基幹系システムで得られるデータ。会計、販売管理、生産管理といったシステムより得る情報で、主に社員が入力する
(2)…顧客接点で得られるデータ。EC(電子商取引)サイトやコールセンターで得られる、顧客や見込み顧客の行動に関する情報
(3)…ブログやソーシャルメディアなど社外から得られるデータ。自社と直接の関わりが無い一般消費者の動向なども知ることが可能

 一般的には、(3)のようなデータをビッグデータとして見ることが多い。ただし(3)について堀内氏は「データの量が格段に多いことに加え、データの構造も定まっていない。 活用事例も限定的な状況であり、取り組みの難易度が高い」と指摘している。製造業や流通業などでも応用可能な、業界を先導するような成功事例やソリューションが登場するまで、まだ時間を要するのかもしれない。

 各ベンダーとしては、どういった業種のユーザーを得意とするかによっても、メッセージが異なっていくことになる。例えば、このような方向性の違いが徐々に出てくる可能性がある。

製造業に強いベンダー…M2M(マシン・ツー・マシン)関連を重視して、品質不良の減少、生産や保守業務の効率化といった効用を強調
基幹系システムやその周辺に強いベンダー…グローバルな経営情報の統合や、分析/活用のリアルタイム性と柔軟性を高めるといった意思決定力の向上を強調
CRMなど情報系やネットマーケティング関連のベンダー…リコールや不買運動につながりかねない品質不良の早期発見や、販売促進策の良しあしをいち早く判断できる効用などを強調

Hadoop周辺の推奨ミドルウエアはOSS?市販品?

 また技術面でも、ビッグデータ市場で大きな存在である分散処理ソフト、Hadoopの周辺でミドルウエアに関するベンダー間の姿勢の違いが少しずつ明らかになってきている。「どこまでOSSのミドルウエアで構成し、どこで独自のミドルウエアを組み合わせるのか」という点だ。

 例えば米EMCは、米MapRテクノロジーズ「MapR」のOEM(相手先ブランドによる生産)版、「Greenplum HD」を取り扱っている。これはHDFS(Hadoop分散ファイルシステム)に関して、Javaで書かれたOSSのオリジナル版ではなく、C++言語で独自に書き直された分散ファイルシステムを同梱したものだ(関連記事:「データサイエンティスト」を育成する)。

 富士通も独自の分散ファイルシステムとApache Hadoopを組み合わせた「Interstage Big Data Parallel Processing Server V1.0」を2012年2月に発表した(関連記事:富士通、ビッグデータ向け「Hadoopパッケージ」を販売開始)。

 このほかに、「専用機(アプライアンス)をビッグデータ関連で製品化するのか」「データサイエンティストと呼ばれるデータ活用の専門家の確保にどう取り組むか」「分析ツールは米SASインスティチュートなど既存のベンダー製品の活用を提案していくのか、それとも統計言語『R言語』の活用を強調していくのか」「分析手法が従来のBI(ビジネスインテリジェンス)と同様なままでもデータがより多くなることで新たな発見があるとするのか、より高度な『機械学習』などの活用手法を訴求していくのか」などについても、ベンダー間でそれぞれ方向性や濃淡の違いが見られる。