今回からは数回にわたってソーシャルデータを使った予測技術の基本を解説する。そのうえで、予測に対する「期待と現実のギャップ」、言い換えれば「一般の人々の期待と分析現場の本音の溝」という部分に焦点を当てていきたい。

 よく企業向けの提言として、「データ活用を推進するならば、分析結果を活用する利用部門と、データ分析担当者(アナリスト)、IT基盤担当者の連携が重要である」ということが言われている。

 だが、ソーシャルデータを活用した予測においては「利用部門とデータ分析担当者の間には、現状では大きな認識の溝がある」ことを指摘したい。ちょうどこの問題を考察するのに格好の題材が少し前に話題になったので取り上げる。

上司:この前、AKB48の総選挙ってあったじゃない。選抜メンバーをファン投票で決めるやつ。
担当者: あぁ、ありましたね(“なぜ突然アイドルの話題…?”)。
上司:「ソーシャルメディアのデータを使った順位予測がけっこう当たった」っていうニュース記事を見たんだ。
担当者:(“あ、そっちの話題か…”)人気投票みたいなものですから当たったんでしょうね。あそこまで当てたのは意外でしたけど。
上司:いや、でもさ、大島優子が1位なのはどこも予想していたし、2位と3位は外してるし、騒ぐほどのものじゃないんじゃないかと思ったけどな。
担当者:票数で見れば結構いい線いってたように見えましたけど、順位は外れたメンバーの影響でけっこう入れ替わっちゃいますからね。
上司:そもそも、予測式がずいぶんシンプルだったけど、現実はもっと複雑なんじゃないの?一人で何百枚も買って投票したりする人もいるんだろ?
担当者:まぁ、それはそうなんですけど、予測に使えるデータを探すのは結構大変ですから…むしろ、あのシンプルさで、よくあそこまで当てたな、と思いましたけどね。

「予測技術」に対する高い関心と期待

 前述の会話で上司は、「順位があまり当たっていない」ことを不満とし、「予測式がシンプルすぎるので、精度を高められる要素を取りこぼしたのではないか。もっと多くの要因を考慮した予測式を作れたのではないか」と評価している。

 一方、予測技術の難しさを知っている部下は「様々な試行錯誤を経てシンプルな予測式にたどり着いたのだろう。シンプルな予測式にしては上々の結果だ」と評価している。

 実際、このような期待と現実のギャップはデータ分析の専門家と、非専門家(一般の人々)の間でよく表面化する。実際に予測を行ううえでの制約条件は、一般の人が想像しているよりはるかに厳しい。利用部門側がそこを理解しておかないと、データ分析担当者とのコミュニケーションの溝はなかなか埋まらない。

 確かに、ソーシャルデータには、ネットのユーザーの認知や評価、思考や感情などが反映されている。「ある商品の売り上げや、株価、選挙の投票結果などを、人々の思考や感情の結果と考えるならば『この先どんな商品が流行るのか』『どの株が上がるのか』『選挙で誰が選ばれるのか』といったことがソーシャルデータを分析して予測できるのではないか」――。これがソーシャルデータを使った予測技術に対する一般的な期待だろう。

 これが実現できれば大変なインパクトがあることは専門家でなくても容易に想像がつく。ゆえにこの種の研究がWebニュースなどで取り上げられると、多くの注目や期待を集める。しかし、そうした世間の期待と、実際の研究やそこで主張されている内容との隔たりはかなり大きい。

 もちろん、そうした期待を寄せる一般の人々を批判するのは筋違いだ。むしろ世間の注目を集めようと、研究者やメディア側がその期待に応えるようなポジティブなメッセージを発信することも多い。