Googleで、早稲田大学関連のページを検索した結果。あるページの順位の変動を、太い青線で示している
Googleで、早稲田大学関連のページを検索した結果。あるページの順位の変動を、太い青線で示している
[画像のクリックで拡大表示]
NHK放送技術研究所が展示した「マルチメディア百科事典」。動物の種類ごとに映像を見られる
NHK放送技術研究所が展示した「マルチメディア百科事典」。動物の種類ごとに映像を見られる
[画像のクリックで拡大表示]

 千葉市の幕張メッセで開催中の「CEATEC JAPAN 2007」では、官民学が共同で検索関連技術の開発に取り組む「情報大航海プロジェクト」がブースを構えている。複数の企業や大学が、情報検索に関する技術展示を行っている。

 そのうちの一つが、早稲田大学 基幹理工学部 山名研究室の「検索エンジンの安心・安全を目指して」。主要な検索エンジンの検索結果を比較し、検索結果の順位付けに偏りがないかどうかを検証するという研究だ。「Google」「MSN」「Yahoo! JAPAN」の3つのWebサイトの検索エンジンを用いて、さまざまなキーワードで検索を実行。上位250件を対象に、どの程度一致しているかを調べた。例えばGoogleとYahoo! JAPANでは、一致したURLは2割程度。8割は、別々のページが検索結果として表示されていることになる。GoogleとMSN、MSNとYahoo! JAPANでも、ほぼ同程度の類似度だった。「検索エンジンの結果はどれも同じだと考えている人も多いだろうが、実際はどのエンジンを使っているかによって、出会うページはかなり異なる」(説明員)。

 同一の検索エンジンの検索結果が、時期によって変動することもある。同研究室では、検索結果を時系列で比較。上位の検索結果については変動は少ないが、下位になるほど変動は大きくなった。また検索エンジンの中で見れば、Googleのランキングが、ほかに比べて時間経過で変動しやすいことも分かったという。このように長期にわたって定量的な調査をすることで、「検索エンジンが恣意(しい)的に検索結果を操作していないかどうかを調べられる」(説明員)。

 NHK放送技術研究所は、番組映像を基にマルチメディア百科事典を生成する技術を展示。自然に関する番組を、映っている動物やその動物の行動の種類で自動分類する。ポイントは、映像は解析せず、番組の字幕放送文を利用して分類すること。文章を解析し、どのシーンにどんな動物が映っているかを特定する。ただ「字幕放送文に動物の名前が出てくるからといって、その動物が映っているとは限らない」(説明員)。機械学習を利用して今映っている動物を説明する際に特有な表現を見つけ、その表現が出てくる映像を切り出す。「教育向け番組やニュース番組の9割ほどは字幕放送文を持っている」(説明員)とのことで、NHKの過去の番組資産を活用すれば、かなり大容量のマルチメディア百科事典を自動生成できそうだ。今後は、旅番組などに応用することも検討しているという。