「Yahoo! JAPANビッグデータレポートは、検索データなどのビッグデータを分析することで、ネットとリアルの世界がつながっていることが見い出せるのではないかとの思いから初めた取り組みだ」「2013年夏の参院選開票前にビッグデータを解析して出した党別の獲得議席予測は、ふたを開けてみるとどの主要メディアよりも正確なものだった。後日、選挙専門誌を含む多数のメディアから取材が殺到した」「1本のビッグデータレポートを0.5人月ほどで作る秘訣は、イシューに沿って5つのステップを踏むことにある」。

写真1●ヤフー 執行役員 チーフストラテジーオフィサー 事業戦略統括本部長の安宅和人氏
写真1●ヤフー 執行役員 チーフストラテジーオフィサー 事業戦略統括本部長の安宅和人氏
[画像のクリックで拡大表示]

 ヤフー 執行役員 チーフストラテジーオフィサー 事業戦略統括本部長の安宅和人氏は2013年10月11日、東京ビッグサイトで開催中の「ITpro EXPO 2013」において「ビッグデータが変える社会予測 ~経済指標、選挙結果、ほぼ的中の舞台裏」と題する講演でこう語った(写真1)。

 「2012年末からこれまでに、Yahoo! JAPANビッグデータレポートを7~8本出している。最初は、2012年12月の衆院選の開票4日前に、ネットのデータがいっぱいあるのだから、リアルとどれくらい関係があるのか見てみよう考えた」と安宅氏。Yahoo! JAPANでは1秒間に5万~数十万ページ、月間だと約540億ページほどが参照されており、それに関連するばく大なデータを持っている。「ビッグデータを選挙結果と比較・分析したところ、例えば小選挙区におけるソーシャルの投稿量と得票数を党別に見た場合、両者には0.98というきわめて高い相関があることが分かった。比例区においても、検索の量と党別の投票量に、0.95という高い相関が見られた。こうした解析結果から、ネットとリアルはつながっていることが見えた」と述べた。

 「解析結果をレポートにまとめ、2012年末にトップからリンクを張っていない、“場末”のページに掲載した。すると、どこで知ったのか、大量の人がそのページに押し寄せてきた。結局、3000を超えるFacebookの“いいね”を獲得する、異常事態になった」(安宅氏)という。次の選挙では事前予測をするのかといった取材が相次ぐなど、反響があまりに大きいことに驚いたそうだ。

 「それならということで、2013年夏の参院選において、ビッグデータを解析して党別の獲得議席予測を出した。ネット上のビッグデータを基に、相関モデルと投影モデルと呼ぶ、2つの異なる分析予測モデルを使って予測した。それを開票後に判明した実際の獲得議席と比べたところ、いずれのモデルにおいても、例えば与党(自民党および公明党)が計76議席といった予測が的中した」と話した。

 選挙区では、16ある複数選挙区のうち13選挙区において、予測が的中したそうだ。「あまりにも予測がピッタリなことから、我々自身も衝撃を受けた」。ただし、課題も見つかったと打ち明ける。「投票率が低かったので、それが地盤の強い党に有利に働くという補正ができていなかった。また、個人でありながら、異常なまでの注目を浴びた山本太郎氏の直前の追い込みを予測できていなかった」。山本氏のケースから、注目度が高ければ、地盤がゼロで票につながりにくい新人でも当選することが証明されたとの見解を明らかにした。