米Xeroxがフランスと米国で6月20日,文脈に依存する検索を実行できる新たなテキスト・マイニング・ソフトウエア「FactSpotter」を発表した。キーワードだけに頼らない手法で,より関連性の高い検索結果が得られるという。

 このソフトウエアは,フランスのグルノーブルにあるXeroxの研究所Xerox Research Centre Europe(XRCE)で開発した。従来の検索ツールと異なり,指示されたキーワードだけでなく,キーワードを含む文書の文脈も検索対象とする。

 例えば,米国の女優「Angelina Jolie」を検索すると,Jolie氏のことを示す「she」が含まれる部分も検索結果として表示する。Xeroxでは「FactSpotterの検索エンジンは,文書の言語や地域,フォーマットなどにかかわらず適用可能」としている。

 Xerox XRCE構文解析&セマンティクス研究マネージャのFrederique Segond氏は「通常の“キーワード”検索や現在のデータ・マイニング・プログラムでは,キーワードの制約が大きすぎるため,関連性のあるすべての文書の40%しか検索対象にしない」と説明する。「(FactSpotterは)文脈を“理解する”ことで,検索している人にとって適切な情報を返すとともに,文書内で回答のある場所を正確に示す」(同氏)。

[発表資料へ]