「ビッグデータ」という言葉が、様々な分野で使われている。「ビッグデータを分析することで新たなビジネスチャンスが得られるのではないか」という期待がある一方で、「これまでと変わらない」という意見も多い。そもそも、「ビッグデータ」という言葉自体、さまざまな理解や定義がなされていることが、議論を一層混沌とさせている。

 ガートナーでは、「高度な洞察や意思決定を行うために、コスト効果が高い革新的な情報処理プロセスを必要とする、大量・高速・多様な情報資産」のことを、「ビッグデータ」と呼んでいる。従来の製品や技術をベースに考えた場合、合理的な時間内で終了しない、あるいは、合理的な時間内で終了できるようにシステムを構築しようとすると、コスト面で折り合わなかったような情報処理プロセスが、前回紹介したような新たな製品や技術の登場により合理的なコストで可能となり、数々の事例が紹介されていく中で注目度が高まったとみている。

ビッグデータの現実的な対象は基幹系業務データ

 図1は、ユーザー企業に対して、ビッグデータとして活用中あるいは活用を検討しているデータの種類を聞いた結果である(ビッグデータを「全く知らない」企業を除く、複数選択)。

図1●ビッグデータとして活用中/活用検討中のデータ
出典:ガートナー「ITデマンド・リサーチ」(2011年11月)
[画像のクリックで拡大表示]

 図に示すとおり、「基幹系業務データ」と答えた企業が71.2%あり、他の選択肢を圧倒している。ビッグデータというと、ソーシャルメディアやセンサーのような新しいデータソース、あるいはビデオや音声を含めた、いわゆる非構造化データに視線が集まりがちだが、この結果を見ると、ユーザー企業においては、新たなデータソースを活用対象に加えることよりも、現在管理・運用している基幹系の業務データを活用することが、喫緊の課題であるといえよう。

 実際、データの管理や運用における課題として、ユーザー企業から耳にすることとしては、「バッチ処理に時間がかかりすぎているので改善したい」「原価に関するシミュレーションのために高速かつ十分な費用対効果の見込めるデータ処理基盤が欲しい」といった、基幹系業務データに関するものが多い。

 やや離された2番手集団が「Webアクセス・ログ」「オフィス文書」「画像」。いわゆる「非構造化データ」である。

 「Webアクセス・ログ」については、Webサイト上で利用者の行動を把握し、収益向上(あるいはコスト削減)につなげようとする取り組みが数多く行われている。より長い期間のデータを保存・分析するために、Hadoopを利用する事例も出てきている。

 「オフィス文書」の管理は、長らく多くの企業において悩みの種となっており、コンテンツ管理やエンタプライズサーチなど新たなテクノロジも数多く登場しつつあるものの、決定打といえるソリューションがない状況である。

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。