日立製作所は2007年7月24日、大規模な画像データベースから似ている画像や映像を高速に検索できる技術を開発したと発表した。市販のデュアルコアCPU、2GBのメモリーと店頭で入手できるレベルのパソコンで、数百万件の画像から似ているデータを1秒以内で検索できるという。デジタルカメラ画像などの検索のほか、映像検索への応用もできる。例えば1万時間分の映像の中から、特定の人物が登場するシーンだけを瞬時に探す、といったことが可能になる。
類似画像検索技術では、一般的に、画像の色分布や構図などを数値化したデータ(特徴量)を基に、画像と画像の類似度を判定する。抽出する特徴量や画像データの量が増えるほど計算量が増大するため、処理速度が低下してしまうという問題がある。そこで今回の技術では、画像の保存時に、似た画像同士をグループ(クラスター)に分ける。さらに各グループに含まれる画像の平均の特徴量を、メモリー上に保持しておく。画像検索実行時には、まず元々の画像の特徴量と、メモリー上にある各クラスターの特徴量を比較。ここで類似したクラスターを複数個抽出し、その中に含まれる画像から似ているものを探す。こうして処理を効率化し、検索速度を向上した。
ハードディスクの画像記録位置も工夫した。同じクラスターに属している画像が、ハードディスク上に連続して並ぶようにした。さらに、類似したクラスター同士も近い位置に記録する。こうして、ハードディスクからのデータの読み出しを高速化した。
ハードディスクの大容量化やブロードバンドの普及により、業務や個人で使用するパソコンにも大量の画像、映像データが蓄積されるようになっている。一般的なパソコンでも、高速な画像検索を可能にする技術として期待できるという。