日本IBM 東京基礎研究所の武田浩一氏
日本IBM 東京基礎研究所の武田浩一氏
[画像のクリックで拡大表示]
人気クイズ番組「Jeopardy!」での対戦風景。中央がWatson。左右にいる対戦者は、過去に同番組で他を圧倒する成績を修めたクイズ王だ
人気クイズ番組「Jeopardy!」での対戦風景。中央がWatson。左右にいる対戦者は、過去に同番組で他を圧倒する成績を修めたクイズ王だ
[画像のクリックで拡大表示]
Watsonの処理の流れ。問題文を基に情報源を検索し、候補を抽出する。それぞれの根拠の強さを算出して、最終的な解答を導き出す
Watsonの処理の流れ。問題文を基に情報源を検索し、候補を抽出する。それぞれの根拠の強さを算出して、最終的な解答を導き出す
[画像のクリックで拡大表示]
1台のコンピューターでは2時間かかる処理を3秒で実行するため、並列処理を採用した
1台のコンピューターでは2時間かかる処理を3秒で実行するため、並列処理を採用した
[画像のクリックで拡大表示]
東京基礎研究所も、さまざまな分野でWatsonの技術開発に寄与した
東京基礎研究所も、さまざまな分野でWatsonの技術開発に寄与した
[画像のクリックで拡大表示]

 コンピューターがクイズ王に勝った――。2011年2月、米IBMが開発したコンピューターシステム「Watson」が米国のクイズ番組に出演し、クイズ王を抑えて優勝したというニュースは、国内でも大きく報道された。このWatsonの開発には、実は日本IBMの東京基礎研究所も携わっている。2011年3月9日、同研究所の武田浩一氏が講演し、Watsonの技術について詳しく説明した。

 武田氏が講演したのは、平成22年度 科研特定領域「情報爆発IT基盤」成果報告会。文部科学省の補助金を受け、2005年度から2010年度にかけて行われた大規模な研究プロジェクト「情報爆発時代に向けた新しいIT基盤技術の研究」の成果報告会で、基調講演を行った。

 Watsonは、約4年の歳月をかけた大規模プロジェクトだったという。世界各地の研究者25名をはじめ、8大学の協力も得て研究開発を進めた。IBMは過去に、チェスの世界チャンピオンを負かしたスーパーコンピューター「Deep Blue」を開発しているが、「それに次ぐグランドチャレンジ」(武田氏)だったという。クイズ問題のジャンルを限定せず、どんな質問でも受け付けるというのは、非常にハードルが高いテーマだ。「人間のレベルに到達することに、研究的な価値があった」(武田氏)。

非構造情報から答えを導き出す

 Watsonの技術は、「質問応答の延長線上にある」(武田氏)。質問応答とは、与えられた質問に対して、解答そのものを返すという技術。インターネット上のWebページなど大量の文書データの中から答えとなり得る情報を抽出するもので、世界中のさまざまな研究機関がこのテーマに取り組んでいる。チェスの次にこのテーマを選んだ理由は、「テキストや画像といった非構造情報(データベースのように構造化されていない情報)が増えている。この状態に対する解を見つけたい」(武田氏)と考えたからだ。

 Watsonが出演したのは、米国で歴史と人気のあるクイズ番組「Jeopardy!」。問題を司会者が読み上げるとともに画面にも表示され、解答が分かった人がボタンを押して答える形式だ。Watsonは音声認識機能を持たないため、文字で問題の情報を取得し、人間の回答者と同じボタンをシリンダーで押して解答した。

 クイズ王との対戦に備え、事前に百科事典サイト「Wikipedia」などから集めた70GBほどのテキスト情報を解析。これを情報源としてWatsonに蓄えておいた。「10年くらい前にWebから集めた情報に比べると、現在Wikipediaのようなソーシャルメディアで作られているものは質が高い」(武田氏)。オンライン上に高品質な情報が豊富にあったことも、Watsonには有利に働いたという。実際の対戦時には、Watsonはインターネットに接続しておらず、内部に蓄積したデータを使って解答した。