注目のセミナー

◆3/7開催◆

スマホ、IP電話、クラウドで始まる内線電話革命

生産性向上とコスト
削減を両立!BYOD、
セキュリティ、災害対策まで徹底解説

必聴講座ご紹介

Cloud Days Tokyo 2012
クラウド時代を勝ち抜く企業戦略を考える

エムオーテックス


Cloud Days Tokyo 2012
クラウド時代の企業インフラとユーザー環境の姿

ヴイエムウェア


Cloud Days Osaka 2012
クラウドでIT維新を〜ビジネスを加速させるベストプラクティス

アマゾン データ サービス ジャパン

情報システム

ニュース

日経コミュニケーション

「2008年はネットの文脈理解が主流に」,米パワーセットが自然語検索サイトを公開

2008/05/12
菊池 隆裕=日経コミュニケーション
写真1 パワーセットのホームページ
写真1 パワーセットのホームページ
[画像のクリックで拡大表示]
写真2 「ハリケーン“カトリーナ”でニューオーリンズから避難した人の数は?」など,自然な質問で検索できる
写真2 「ハリケーン“カトリーナ”でニューオーリンズから避難した人の数は?」など,自然な質問で検索できる
[画像のクリックで拡大表示]
写真3 「東京で地震が起こったのはいつ?(when did earthquake hit Tokyo?)」に対する検索結果
写真3 「東京で地震が起こったのはいつ?(when did earthquake hit Tokyo?)」に対する検索結果
[画像のクリックで拡大表示]
写真4  “factz”では,文脈を理解した上で検索結果を整理して提示する
写真4  “factz”では,文脈を理解した上で検索結果を整理して提示する
[画像のクリックで拡大表示]
写真5 創業者の一人であるバーニー・ペル氏
写真5 創業者の一人であるバーニー・ペル氏
[画像のクリックで拡大表示]

 自然言語処理技術を開発する米国のベンチャー企業パワーセットが,米国東部時間の2008年5月12日0時から新サービスを公開した(パワーセットのホームページ,写真1)。まずはインターネット上の無料の百科事典サービス「Wikipedia」を運営するウィキメディア財団,およびオープン・データベース「freebase」を開発する米メタウェブ・テクノロジーズと共同で,Wikipediaの付加サービスとして始めた。

 パワーセットのホームページから利用できる新サービスでは,すべてのWikipediaコンテンツが検索の対象となり,GoogleやYahoo!といった既存の検索サービスで使われる単語(キーワード)や短いフレーズだけではなく,実際の質問に近い形での問い合わせにも答えられる。例えば,「癌の治療法は?(what treats cancer?)」「ハリケーン“カトリーナ”でニューオーリンズから避難した人の数は?(how many people were evacuated from new orleans during hurricane katrina?,写真2)」「東京で地震が起こったのはいつ?(when did earthquake hit Tokyo?)」といった具合だ。

 最後の質問への回答では,Wikipediaの「Tokyo」中の「気候と地震」欄にある情報から1703年,1782年,1812年,1855年,1923年に大地震があったこと,東洋における女性解放運動における記事中にある,関東大震災に関する記述を示している(写真3)。日本における女性解放運動は,1923年に起こった関東大震災と関連が強いことから上位にランクされている。

 もう1つの大きな特徴は,同社の中核技術である文の意味を理解する技術(semantic analysis)により,検索結果を自動的に整理してくれること。例えば,「ソニー」で検索した場合,「released(主に具体的な製品)」「announced(発表内容全般)」「introduced(主に,技術や製品ジャンル)」別に,検索結果を提示してくれる(写真4)。パワーセットでは,これを“factz”と呼んでいる。

 このほか,検索結果の要約を示す“Dossiers”,最もユーザーの質問に合致するとみられる結果をハイライトする“Semantic Highlighting”,文脈に応じて文末まで記事を表示する“Minibrowser”といった処理によって,すべての文を読む前に目的の情報を見つけてくれたり,内容の要点を知ることができる。同社創業者でCTO(最高技術責任者)のバーニー・ペル氏(写真5)は「単にWikipediaの情報を検索しやすくするだけでなく,Wikipediaの情報のよりよい読解や探索,案内にもつながる。Wikipediaのユーザー体験をより豊かなものにできる」という。

 これら一連の新サービスのメリットは,「情報へのアクセスを容易にすること」(ペル氏)にある。ウィキメディア財団のような情報提供者にとっては死蔵する情報へのアクセスを増やすことにつながり,ユーザーにとっては目的の情報に到達できる時間や手間を省くことができる。同社では今回のリリースが「検索方法を変える最初の一歩」と位置づけている。ペル氏は「2008年は,文脈理解と自然言語処理の技術が台頭し,主流になる記念すべき年だ」と語った。

 同社のビジネスモデルの収益源は,情報提供者からの広告収入と,検索エンジンを導入する企業からのライセンス収入の2種類を想定している。新聞や雑誌など大量のテキスト情報を抱える企業が,利用の対象になるだろう。

 同社の自然言語技術は,「基本的には言語非依存」(ペル氏)とする。既にWikipedia日本語版のプロトタイプも用意されているが,まずは英語版の公開に注力したという。

 パワーセットは,2005年12月に設立されたベンチャー企業で,本社はサンフランシスコ市内にある。2007年9月にはインターネット上に「Powerlabs」を発足,登録者による技術レビューを実施していた。同社には,主要なベンチャー・キャピタルのほか,著書「未来地球からのメール」などで有名なエスター・ダイソン氏ら個人投資家が出資している。

この記事に対するfacebookコメント

nikkeibpITpro

読みましたか? 〜 未読記事をご紹介