写真1●電気通信大学 笠井研究室が開発中の音響合成システム「Ototabi」 音が紹介できないのが残念。
写真1●電気通信大学 笠井研究室が開発中の音響合成システム「Ototabi」 音が紹介できないのが残念。
[画像のクリックで拡大表示]
写真2●森田研究室が開発中の「ニュース映像のトピック分割技術」のデモ
写真2●森田研究室が開発中の「ニュース映像のトピック分割技術」のデモ
[画像のクリックで拡大表示]

 2011年5月25日から27日まで、無線およびモバイル通信関連の展示会「ワイヤレスジャパン2011」が東京ビッグサイトで開催されている。会場内の一角にある電気通信大学 森田研究室・笠井研究室のブースでは、「地図上の任意地点の環境音」を聞くことができるという音響合成システム「Ototabi」や、地デジ放送などのニュース映像をトピックごとに自動分割できるという「ニュース映像のトピック分割技術」などの興味深い研究成果物を展示している。

 笠井研究室が開発中のOtotabiは、ユーザーがWebブラウザーで表示している地図上の任意の地点をクリックすると、その地点に立ったときに聞こえてくる「環境音」を再生するというシステム。例えば、近くに川がある場所を指定した場合、川のせせらぎが、いかにもといった感じでスピーカーから再生される。渋谷駅前のスクランブル交差点を指定すれば、ざわざわとした人ごみの音に加えて電車の通過音なども聞こえるという具合だ(写真1)。

 もちろん、実際に地図上のあらゆる地点で音を収録することはできないので、録音済みの音を地図情報に合わせて合成することで「それっぽい音」を作り出している。このとき、1種類の音を再生するのではなく、その場所の基本的な環境音を表す「バックグラウンド音」に、突発的なイベントを表す「イベント音」をリアルタイムに合成することで、より現実感のある音を作り出す工夫をしている。

 上述した渋谷駅前のケースなどがまさにそうしたリアルタイム合成の効果が分かる典型例で、会場で実際に聞いてみたところ、「渋谷駅前で録音した音」と言われても分からないほどリアルな印象の音が再生されていた。同研究室によれば、今のところ音のジャンルは50種類、音源ファイルは300ファイルほどを用意しているとのことだ。

テロップを認識しニュース映像を自動的に分割・整理

 森田研究室が研究開発を進めているニュース映像のトピック分割技術も、なかなかユニークな技術である。ニュース映像では、画面下や左右上方にテロップが表示されることが多いが、同技術はこのテロップ表示などを認識して映像を自動的に分割するというもの。分割した映像はサムネイル形式で確認でき、必要なトピックだけを素早く探して鑑賞できる(写真2)。

 テロップ表示の検出には、画面に表示される文字情報のパターン認識などといったアナログ的な手法は使わず、純粋にMPEG-2/4の圧縮データに含まれる色情報や動きベクトルの変化などを基に判定しているという。具体的には、「動きベクトルが0かつDCT(離散コサイン変換)係数の絶対値の和が一定のしきい値以上のMB(マクロブロック)」をテロップと判定する。

 ブース内で説明に当たっていた電気通信大学の森田啓義教授によれば、現状で分割精度は86パーセント以上で、今後は精度を高めるという。さらに、「分割した映像のうち、視聴者が実際にどのトピックに興味を持っているかを調べてその情報を共有するといった研究も進める」(森田教授)としている。