音楽業界がビッグデータ革命に揺れている。定額で聴き放題のストリーミング(逐次再生)型サービスがいよいよ日本でも本格普及。その魅力は、膨大なカタログから消費者一人ひとりにその瞬間のお薦めの曲を提案できる点にある。そのためには消費者の好みを学び、楽曲1曲ずつの「個性」も把握し、両者をマッチングさせる必要がある。よりどころになるのがデータだ。配信会社はライバルより少しでも多く曲調や消費者の行動状況に関するデータを集め、さらに「深く」「広く」分析しようとしのぎを削る。その裏側を、音楽専門のビッグデータ分析会社である米グレースノートの日本法人でCTO(最高技術責任者)を務める渡辺泰光取締役や、米国本社の共同創設者であるタイ・ロバーツCSO(最高戦略責任者)が数回に渡ってひもといていく。

数千分の1秒で映像の中身を特定

画面●コンテンツ認識技術でテレビCMの姿も変わる(提供:グレースノート日本法人)
画面●コンテンツ認識技術でテレビCMの姿も変わる(提供:グレースノート日本法人)
[画像のクリックで拡大表示]

 音楽の世界ではぐくまれたメタデータの概念が、テレビや映画などの映像分野まで活躍の場を広げている。米グレースノートは音声フィンガープリントを使ったコンテンツ自動認識技術(ACR)を発展させ、進化版の「映像フィンガープリント」によるACRを開発した。DVDの中身を特定したり、オンエア中のテレビ番組名をリアルタイムに認識したりすることが可能になっている。

 映像フィンガープリントの特徴は、数秒かかる音声による認識と違って、映像自体を認識することで解析スピードを格段に短縮したことだ。数千分の1秒という早さでコンテンツ名の特定が可能となったおかげで、テレビCMの自由度も増す。例えば視聴者の属性にあわせたターゲティング広告を提供可能になり、自動車会社フォードの場合、CM中に視聴者の近くの販売店情報を画面下部にバナーとして表示している。放映が始まる瞬間にフォードのCMだとテレビが認識し、視聴者の現在地を生かして、それぞれの地域に応じたバナー広告を配信する仕組みだ。