富士通研究所は1月20日,音声ファイルの編集作業と改ざん防止を両立させる技術「PIAT」(仮称)を学会発表した。これまでXML文書や監視カメラ映像を対象に開発を進めてきた改ざん防止技術の対象を,音声データに拡大したものだ。開発メンバーのソフトウェア&ソリューション研究所セキュアコンピューティング研究部の吉岡孝司氏に,動作原理と市場性を聞いた。

(聞き手は,高橋 秀和=ITpro


動画や音声の編集作業と改ざん防止を両立させるために必要な要素は何か。

写真1●左から富士通研究所ソフトウェア&ソリューション研究所セキュアコンピューティング研究部の鳥居直哉部長,吉岡孝司氏,武仲正彦主任研究員
写真1●左から富士通研究所ソフトウェア&ソリューション研究所セキュアコンピューティング研究部の鳥居直哉部長,吉岡孝司氏,武仲正彦主任研究員
[画像のクリックで拡大表示]

 ファイルを編集単位に分けたうえで電子署名を施すのがPIATの基本技術だ。編集によって必要な部分だけを取り出せるため,単に「保存」するだけでなく「流通」させられる可搬性を確保できる。

 一般に電子データの原本性を保証するためには,ファイルからハッシュ値を生成し,そのハッシュ値に対して電子署名を施す。シーンの一部を切り取ったり入れ替えたりする編集作業は,従来の改ざん防止技術からすれば改ざん行為そのもの。ファイルの一部を変更すれば,ハッシュ値が一致しないため改ざんと見なされる。そこでPIATでは,ファイルを編集単位に分けたうえでハッシュ値を生成するようにした。

 これまでXMLファイルの要素,静止画のブロック,PDFファイルの属性情報,MPEG-1動画のGOP(Group Of Pictures)を分割の単位として応用範囲を広げてきた。編集単位ごとにハッシュ値を生成してそれぞれに電子署名を施すことで,電子署名の持ち主による不要部分の削除を実現すると同時に,削除した個所以外のデータに改ざんがないことを証明できる。編集によって必要な部分だけを取り出せるため,単に保存するだけでなく流通させられる可搬性を得られるのが最大のメリットだ。

今回の応用分野を音声ファイルにした意図は。

写真2●コンテンツの編集可能な改ざん防止技術「PIAT(仮称)」
写真2●コンテンツの編集可能な改ざん防止技術「PIAT(仮称)」
[画像のクリックで拡大表示]

 コールセンター向けの商用化をにらんで開発の優先順位を上げた。金融商品の勧誘に対して説明義務を課す金融商品取引法や改正金融商品販売法などが施行され,電話による顧客とのやり取りを記録した音声データの重要性が高まりつつある。その音声データを単にアーカイブするだけでなく,顧客のプライバシーに当たる部分は削除して訴訟時の証拠などに生かす,といった利用シーンを想定している。

 音声ファイルにPIATに応用する際,MP3フォーマットへの対応が技術的な課題となった。WAVやAACといったほとんどの音声フォーマットは,MPEGのGOPなどと同じく,ある決まった単位で分割してハッシュ値を生成する手法がそのまま適用できる。一方MP3は,音声データとそのアドレス情報が可変のフレームとなっており,アドレス情報の格納場所を特定したうえで音声データのみのハッシュ値を生成する必要があった。

製品化のめどは。技術的にクリアすべき課題は残っているのか。

 2010年3月までに,まずはコールセンター向けのソリューションとして実用化を目指す。MP3以外の音声フォーマットは比較的容易にPIATを適用できるため,必要な要素技術は揃っている。

 映像については,Motion JPEGフォーマットへの対応を済ませれば,既に開発済みのMPEG-1と合わせて監視カメラ映像向けのニーズはある程度満たせると考えている。Motion JPEGはJPEG画像の集合に過ぎず,対応は容易だ。MPEG-2やMPEG-4,H.264といった主要な動画フォーマットについても,市場動向を見ながら開発を進めていく。