ペタバイト級のデータを収集・分析し、その結果を活用する──。「ビッグデータ」に挑む企業が増加しつつある。専門家でさえ気づかない事象の変化への対応、人を介さない意思決定の実現をはじめ、ビッグデータがもたらす効果は計り知れない。ビジネスのあり方、ひいては産業構造まで変えるほどの力を秘めているのだ。ビッグデータの活用を支える製品やサービスも急ピッチで整備が進む。いま起こりつつあるビッグデータ革命の実態に迫る。

(中田 敦)

◆ビッグデータは奇跡を起こす
◆三つの活用シナリオ
◆Hadoop軸に品ぞろえ充実
◆最大の課題は人材不足


【無料】サンプル版を差し上げます 本記事は日経コンピュータ9月15日号からの抜粋です。そのため図や表が一部割愛されていることをあらかじめご了承ください。本「特集」の全文をお読みいただける【無料】サンプル版を差し上げます。お申込みはこちらでお受けしています。 なお本号のご購入はバックナンバーをご利用ください。

 2011年7月。米カリフォルニア州サンタクルーズ市で不思議な現象が起こった。犯罪が発生する前に、犯罪現場に警察官が現れるようになったのである。

 10年10月。コンピュータ将棋「あから」が女流王将のプロ棋士に勝利した。あからで使っているプログラムは、将棋初心者の化学者が開発したものだ。

 同月。運転手が存在せず、周囲の状況を判断して自分で走る「自動運転自動車」が、米カリフォルニア州の公道を22万キロメートル無事故で走った。開発したのは自動車メーカーではなく、米グーグルである──。

 一見、何の関係もない三つの現象。だが、いずれもこれまでは想像もできなかったこと、従来は不可能だと思われていたことが現実になった点で共通している。

 これらの「奇跡」の共通点はもう一つある。いずれも「ビッグデータ」を活用していることだ()。ビッグデータとは、ペタバイト級の大量データを指す。

図●ビッグデータがビジネスや産業を変え始めている<br>ペタバイト級の「ビッグデータ」を、機械学習のような高度なデータマイニング手法で分析することによって、従来は不可能だと思われていたことを実現する事例が相次いでいる。それが「ビッグデータ革命」である
図●ビッグデータがビジネスや産業を変え始めている
ペタバイト級の「ビッグデータ」を、機械学習のような高度なデータマイニング手法で分析することによって、従来は不可能だと思われていたことを実現する事例が相次いでいる。それが「ビッグデータ革命」である
[画像のクリックで拡大表示]

 ビッグデータを収集・分析して、あるパターンやルールを見つけ出す。発見したパターンやルールを使って、現実世界で起きる出来事(イベント)に対する判断を自動で下す。三つの現象は、こうしたビッグデータ技術によって実現したものだ。

 ビッグデータ技術は、時には人間を上回る判断力や知性を生み出す。コンピュータ将棋「あから」で使っているBonanzaというプログラムは、過去のプロ棋士による対局の棋譜から自動的にパターンを見つけ出す。膨大な棋譜データを学習することで、盤面でどの手を指すのが最も効果的かを判断する「大局観」を自ら生み出した。結果的に、プロ棋士を負かすほどの実力を身に付けたのだ。

奇跡がコモディティー化する

 ビッグデータによる奇跡は、誰もが起こせるようになりつつある。ビッグデータ技術のコモディティー(日用品)化が進んでいるからだ。ブロードバンドの普及と価格低下、ストレージの容量拡大、大量データを処理・分析できる分散処理ソフトや統計解析ソフトのオープンソースソフトウエア(OSS)化、クラウドコンピューティングの台頭などが背景にある。

 特に寄与しているのはクラウドである。データの収集や分析、分析結果を生かした処理が容易になるからだ。

 現在、あらゆるITベンダーがビッグデータを支える製品やサービスの提供に血眼になっている。IBMやヒューレット・パッカード(HP)、EMCといった米国のベンダーだけでなく、富士通やNEC、日立製作所、野村総合研究所(NRI)、NTTデータなど国内勢の動きも盛んだ。ベンダーの競争によって、コモディティー化は今後さらに加速する。

 ビッグデータ技術のコモディティー化は、ビジネスや産業構造に劇的な変化をもたらす。これまで不可能だったことが可能になる、後発企業が先発企業に打ち勝つといった事態が、至るところで起きるだろう。蒸気機関の発明とコモディティー化を「産業革命」と呼ぶように、この動きは「ビッグデータ革命」と呼べるはずだ。

電力や自動車に革命の萌芽

 いま電力や自動車といった産業で、ビッグデータ革命の萌芽が見え始めている。動いたのはグーグルだ。

 昨年10月には丸紅などと、大西洋沖の洋上風力発電所と米国東部地域とを結ぶ大規模な海底送電網を建設すると発表した。総事業費は最大5000億円で、600万kWを供給できる予定だ。供給電力量は、四国電力(570万kW)や北陸電力(680万kW)に匹敵する。

 冒頭で触れた自動運転自動車の開発は、昨年10月に発表した。自動運転自動車は、車体に付いた画像センサーなどの各種センサーから自動車自身が周囲の状況を判断し、自律的に運転する。

 グーグルが異業種への参入を始めたのは、検索エンジンの開発で磨いたビッグデータ技術の威力に気付いたからにほかならない。

 風力発電を例に採ろう。事業化するためには「スマートグリッド」が欠かせない。風力発電による発電量は、時々刻々と変化する。安定しない電力を家庭に配電するために、風力発電所の発電量や家庭での電力消費をリアルタイムでモニタリングし、電力の需給バランスを細かくコントロールする必要がある。それには大量データの処理・分析が不可欠だ。

 自動運転自動車は、車体に付けた画像センサーなどで周辺の状況を判断し、最適な運行を支える。センサーを使った状況判断処理(パターン認識と呼ぶ)を高速かつ正確に実行できないと、自動運転自動車の実用化は不可能だ。画像のパターン認識の精度は、事前に解析した画像の数が多ければ多いほど高くなる。

グーグルと組んだフォード

 トヨタ自動車やホンダ、日産自動車といった自動車大手は、自動車の燃費を最適化するようなカーナビを実現する「自動車クラウド」の開発にしのぎを削っている。自動車クラウドで出遅れた感のある米フォードは、グーグルと組んで巻き返しを図っている。

 今年5月、フォードはバッテリーとガソリンエンジンとを組み合わせた「プラグインハイブリッド車」の走行システムをグーグルと共同開発すると発表した。ユーザーの目的地を予測して、最適な燃料配分をユーザーに提案するというものだ。

 目的地まで予測する走行システムを両社が開発する狙いは、ドライバーの負荷軽減にある。欧州の都市には近い将来、ガソリンエンジンの使用を制限する「環境ゾーン(グリーンゾーン)」が設置される予定だ。プラグインハイブリッド車のドライバーは、環境ゾーンに入る前にバッテリーを使い切らないよう、細心の注意を払う必要がある。走行システムがユーザーの目的地を予測し、環境ゾーン内での走行を加味してエネルギーを配分してくれれば、ドライバーの負担はそのぶん軽くなる。

 このような走行システムを作るには、ドライバーの移動履歴を分析し、その時々の時刻や場所から次の目的地を予測する必要がある。フォードは移動履歴の分析や、ルートの予測計算などに、グーグルのデータ分析クラウドの機能を使用する。


続きは日経コンピュータ9月15日号をお読み下さい。この号のご購入はバックナンバーをご利用ください。