自然言語処理技術を開発する米国のベンチャー企業パワーセットが,米国東部時間の2008年5月12日0時から新サービスを公開した(パワーセットのホームページ,写真1)。まずはインターネット上の無料の百科事典サービス「Wikipedia」を運営するウィキメディア財団,およびオープン・データベース「freebase」を開発する米メタウェブ・テクノロジーズと共同で,Wikipediaの付加サービスとして始めた。
パワーセットのホームページから利用できる新サービスでは,すべてのWikipediaコンテンツが検索の対象となり,GoogleやYahoo!といった既存の検索サービスで使われる単語(キーワード)や短いフレーズだけではなく,実際の質問に近い形での問い合わせにも答えられる。例えば,「癌の治療法は?(what treats cancer?)」「ハリケーン“カトリーナ”でニューオーリンズから避難した人の数は?(how many people were evacuated from new orleans during hurricane katrina?,写真2)」「東京で地震が起こったのはいつ?(when did earthquake hit Tokyo?)」といった具合だ。
最後の質問への回答では,Wikipediaの「Tokyo」中の「気候と地震」欄にある情報から1703年,1782年,1812年,1855年,1923年に大地震があったこと,東洋における女性解放運動における記事中にある,関東大震災に関する記述を示している(写真3)。日本における女性解放運動は,1923年に起こった関東大震災と関連が強いことから上位にランクされている。
もう1つの大きな特徴は,同社の中核技術である文の意味を理解する技術(semantic analysis)により,検索結果を自動的に整理してくれること。例えば,「ソニー」で検索した場合,「released(主に具体的な製品)」「announced(発表内容全般)」「introduced(主に,技術や製品ジャンル)」別に,検索結果を提示してくれる(写真4)。パワーセットでは,これを“factz”と呼んでいる。
このほか,検索結果の要約を示す“Dossiers”,最もユーザーの質問に合致するとみられる結果をハイライトする“Semantic Highlighting”,文脈に応じて文末まで記事を表示する“Minibrowser”といった処理によって,すべての文を読む前に目的の情報を見つけてくれたり,内容の要点を知ることができる。同社創業者でCTO(最高技術責任者)のバーニー・ペル氏(写真5)は「単にWikipediaの情報を検索しやすくするだけでなく,Wikipediaの情報のよりよい読解や探索,案内にもつながる。Wikipediaのユーザー体験をより豊かなものにできる」という。
これら一連の新サービスのメリットは,「情報へのアクセスを容易にすること」(ペル氏)にある。ウィキメディア財団のような情報提供者にとっては死蔵する情報へのアクセスを増やすことにつながり,ユーザーにとっては目的の情報に到達できる時間や手間を省くことができる。同社では今回のリリースが「検索方法を変える最初の一歩」と位置づけている。ペル氏は「2008年は,文脈理解と自然言語処理の技術が台頭し,主流になる記念すべき年だ」と語った。
同社のビジネスモデルの収益源は,情報提供者からの広告収入と,検索エンジンを導入する企業からのライセンス収入の2種類を想定している。新聞や雑誌など大量のテキスト情報を抱える企業が,利用の対象になるだろう。
同社の自然言語技術は,「基本的には言語非依存」(ペル氏)とする。既にWikipedia日本語版のプロトタイプも用意されているが,まずは英語版の公開に注力したという。
パワーセットは,2005年12月に設立されたベンチャー企業で,本社はサンフランシスコ市内にある。2007年9月にはインターネット上に「Powerlabs」を発足,登録者による技術レビューを実施していた。同社には,主要なベンチャー・キャピタルのほか,著書「未来地球からのメール」などで有名なエスター・ダイソン氏ら個人投資家が出資している。