外国人観光客の急増や2020年に迫る東京オリンピック開催を背景に、多言語翻訳システムの開発が熱を帯びている。総務省は2015年度予算案で、多言語音声翻訳システムの開発に13億8000万円の新規予算を盛り込んだ。目指すは「世界の言葉の壁をなくす」こと。情報通信研究機構(NICT)を中心に今後5年をかけて開発を進め、2020年には旅行や医療などさまざまな分野で実用化する計画だ。

 多言語の音声翻訳システムがあれば、さまざまな国の人と互いの母国語を使って会話ができる。まるで夢の世界のようにも思えるが、2020年までに本当に実現できるのか。

 この問いに、NICT ユニバーサルコミュニケーション研究所の隅田英一郎副研究所長は「旅行での会話や基本的な日常会話なら、絶対にできる」と断言する(写真1)。統計翻訳と呼ばれる新手法によって、機械翻訳の精度が大幅に向上しているからだという。

写真1●情報通信研究機構 ユニバーサルコミュニケーション研究所 副研究所長を務める隅田英一郎氏
写真1●情報通信研究機構 ユニバーサルコミュニケーション研究所 副研究所長を務める隅田英一郎氏
[画像のクリックで拡大表示]

大規模なデータを自動学習

 機械翻訳技術は、数十年にわたって研究開発が続けられてきた。従来は、文の構造などのルールや言葉の意味を記した辞書を人間が用意し、それに基づいて翻訳を行う手法が主に用いられてきた。この方法でも一定の精度は出せるが、「あるところから精度が上がらなくなる」(隅田氏)。人間が用意できるルールや辞書には限界があるためだ。