KDDI研究所は2004年4月8日,映像コンテンツのハイライト・シーンを抽出し,ダイジェストを自動生成する技術を開発したと発表した。MPEG-1/2/4形式で圧縮されたデータを展開せずにダイジェストを作成できるのが特徴である。

 ダイジェストを作成できるのは(1)野球,サッカー,テニス,ゴルフ,相撲などのスポーツ,(2)ニュース番組,(3)映画,ドラマ,ドキュメンタリなどのストーリー性のあるコンテンツなど。(1)は得点シーンなど全体として盛り上っているシーン,(2)はアナウンサがニュースを読み上げている部分を抽出する。(3)はストーリを保持したまま数時間のコンテンツを数分のダイジェストに作り変える。KDDI研究所によれば「スポーツの得点シーンなど盛り上った部分は90%以上の確率で抽出可能。ストーリのあるコンテンツに関しては,あらすじを解説しているWebページと比較して80%程度のシーンが含まれていた」という。

 ダイジェストは,音声,映像の特徴を解析することで作成する。音声の場合は,ナレーション,会話,歓声,効果音やBGMの変化などを解析する。映像の場合は,動きが大きさなどを解析する。例えばスポーツの場合,歓声が大きく,映像の動きが大きい場合,盛り上っている場面と見なせる可能性が高い。ドキュメンタリならば,ナレーションが入り,カメラが固定されている場合に重要な場面である可能性が高いという。このような映像と音声の全体的な傾向を捉えることで全体を通して重要なシーンを抽出する。

 この技術はインターネットを利用した動画コンテンツ・ダイジェスト配信サービス,ハードディスク・レコーダのダイジェスト再生や録画番組管理などに適用できるという。2004年夏ごろには,ハイライト自動生成とフォーマット変換機能を持つ業務用ソフトとして販売する。また将来的にライブラリやソフトウェア開発キットの形態でライセンス販売する予定。

(中道 理=日経バイト)