写真●YouTubeの著作権管理ツールの仕組みを説明するグーグルの水野有平コンテンツパートナーシップ統括部長
写真●YouTubeの著作権管理ツールの仕組みを説明するグーグルの水野有平コンテンツパートナーシップ統括部長
[画像のクリックで拡大表示]

 尖閣諸島沖での中国漁船との衝突ビデオの無断公開事件を契機に、国民の「コンテンツ所有者に無断で動画配信サイトへアップロードされた動画の行方」に対する関心が高まっている。参院予算委員会でビデオ映像の公開が決定されるなど、いまだ騒動が収まらないさ中の2010年11月24日、グーグルは記者向け説明会を開催し、同社の動画配信サービス「YouTube」の著作権管理についての取り組みやツールなどを紹介した。

 グーグルによれば、現在YouTubeには「1分間当たり35時間分」もの量の動画コンテンツがユーザーによってアップロードされ続けているという。これら膨大なコンテンツの中には、暴力や性的な描写などを含む有害動画や、著作権保有者に無断でアップロードされた動画なども含まれているが、YouTubeではこうしたコンテンツをブロックするために「MD5ハッシュ」「3ストライク」「YouTubeコンテンツIDシステム」という3つの技術を導入している。

 MD5ハッシュは、動画ファイル全体のMD5ハッシュ値を取り、ハッシュ値が一致するファイルをほかのユーザーがアップロードできなくするという仕組み。3ストライクは、違反コンテンツを繰り返しアップロードするユーザーに対して強制的にアカウントを削除するという措置である。

 ただ、MD5ハッシュは、アップロードするファイルが少しでも編集されていれば検出できない。3ストライクについてはアカウントの取り直しで対抗可能だったり、そもそもユーザーからの違反申告ベースなので対応の遅れや漏れ、誤りなどが発生しやすかったりするという課題がある。

フレームごとの「光の周波数成分」を基に違反を見抜く

 そこで、この2つに加える3つめの技術として米Googleが自社開発し、2007年10月から導入している著作権管理技術が「YouTubeコンテンツIDシステム」だ。

 コンテンツ所有者が保護したいコンテンツをYouTubeにバックエンドでアップロードすると、YouTubeによって固有の「コンテンツID」が生成される。コンテンツIDには、例えば映像なら個々のフレーム(コマ)に分解したときの画像に含まれる「光の周波数分布と量」がひも付けられている。この光の周波数成分の流れ(変化)を比較することで、ある映像の任意の部分が指定した映像の一部分とマッチするかどうかを判定する。

 グーグルによれば、特に映像に関しては現状でも99%以上の高い検出精度を誇るとしている。「動画をテレビに映している状態を枠ごと撮影した、いわゆる再撮動画でも正しく判定できる」(グーグルの水野有平コンテンツパートナーシップ統括部長、写真)。

 コンテンツIDが一致判定される動画ファイルをほかのユーザーがアップロードしようとした場合、(コンテンツ保有者がブロックするように設定していれば)動画の公開は事前にブロックされ、そのユーザーに警告メールが送られると同時にコンテンツ保有者にも即座に報告が送られる仕組みになっている。「以前は違法な動画でもいったんは公開されてしまっていたが、現在では一度も閲覧されることなく止められる」(グーグルの水野氏)という。

 YouTubeコンテンツIDシステムを利用するには、同社とパートナー契約を結ぶ必要がある。2010年11月現在、パートナー数は世界全体で1000社以上に上るとしている。国内のパートナー数については明らかにしなかったが、2010年は2009年に比べて約2倍に増えたという。これらのパートナーが生成したコンテンツIDは400万個以上(前年比4倍)、時間にして延べ30万時間以上にも上るとしている。