◆今回の注目NEWS◆
◎米政府がビッグデータ活用の取り組みを立ち上げ、約2億ドルを投じる
(ITpro、3月30日)
◆このNEWSのツボ◆
世の中が、クラウドコンピューティングの大ブームであったかと思うと、今度は「ビッグデータ」だそうである。ただ、筆者は昨今の「ビッグデータ・ブーム」に若干の懸念を覚えている。
ウィキペディアによればビッグデータとは、「通常のデータベース管理ツールなどで取り扱うことが困難なほど巨大な大きさのデータの集まり(構造化データ+半構造化データ+非構造化データ)であり、その格納、検索、共有、分析、可視化などに困難さを伴うもの」であり、「気象学や生化学、複雑な物理シミュレーション、インターネット検索、経済学、経営情報学などの分野で科学者が直面してきた課題である」とされている。
たしかに、スマートフォンをはじめとするモバイルデバイスの急速な普及、各種の画像データの処理・蓄積量の増大によって、企業や公的な機関、さらにはネット上に蓄積されてきたデータ量は膨大なものになっている。ただ、こうしたデータは、あらかじめデータ同士の関係性などが精緻に定義付けられていないことがほとんどであるため、これを利用する際に従来のようなデータ同士の関係性を基本に構築されたデータベースモデルなどでは取り扱えない、あるいは取り扱いにくいことが多い。このため、これを活用する概念として「ビッグデータ」という用語が頻繁に用いられ始めたようである。
しかし、「ビッグデータ」というのは、多くの解説に書かれているように、いくらを超えたらビッグデータなのかという定義があるわけではない。利用者によっては数百ギガバイトのデータがビッグデータになることもあるだろうし、数ペタバイトのデータ利用に悩む利用者もいるだろう。要は「ビッグデータ」というのは、未利用で放置されていた大量のデータを「何のために、いかに利用していくのか」が鍵なのであって、大量のデータをしゃにむにため込むことを指すのではない。
ここで気になるのは、すでに「ビッグデータ・ソリューション」と称して、さまざまなデータのストレージであるとか、その利用システムが大々的にセールスされ始めていることである。繰り返しになるが、ビッグデータは、まず、「蓄積された大容量データをどのように使うか」という目的意識・問題意識から始まらなければ、意味がない。単純に大量のデータをため込んだだけでは、高い機械やストレージを買ったものの、データ利用率はコンマ何%などということが起こりかねない。
かつて、ASP(アプリケーションサービスプロバイダー)という言葉がはやったときに、むやみやたらにデータセンターにコンピュータを運び込み、遠隔で利用することが「ASP」であるかのようなビジネスが横行した。そういえばデータマイニングという言葉・ソリューションもあった。かつてのデータマイニングと今日のビッグデータ・ソリューションの本質的な違いは何だろうか。明確に答えられる人は少ないのではないだろうか。
たしかに、先に述べたように、今日、企業や公的機関、ネットの上には人類史上想像もつかなかったような情報が蓄積されつつある。これを「どう利用するか」は、まさに利用者の英知が問われるところである。この「ビッグデータ」ブームが、単なる一過性の流行に終わらないことを祈るばかりである。
フューチャーアーキテクト 取締役 事業提携担当、
スタンフォード日本センター理事