米マイクロソフトは2017年4月7日、機械翻訳サービス「Microsoft Translator」で、日本語の翻訳アルゴリズムを深層学習(ディープラーニング、多層ニューラルネットワークによる機械学習)ベースのものに切り替えた。米グーグルに続き、マイクロソフトも日本語翻訳アルゴリズムを深層学習に移行したことになる。

 実はマイクロソフトがテキスト翻訳に深層学習を組み込んだのは、日本語向けテキスト翻訳の研究がきっかけだったという。テキスト翻訳技術の研究開発と、翻訳サービスを支えるクラウドインフラについて、機械翻訳プロダクト戦略を担当するオリヴィエ・フォンタナAI&Researchグループディレクターに聞いた。

(聞き手は浅川 直輝=日経コンピュータ


テキスト翻訳に深層学習を本格導入しようと考えたのはいつか。

米マイクロソフト AI&Researchグループディレクターのオリヴィエ・フォンタナ氏
米マイクロソフト AI&Researchグループディレクターのオリヴィエ・フォンタナ氏
[画像のクリックで拡大表示]

 2016年2月ごろのことだ。これまで機械翻訳と言えば、膨大な対訳テキストの統計解析に基づき、単語やフレーズ単位で対訳を出力する統計的機械翻訳が主流だった。

 だが統計的機械翻訳では、文章構造が大きく異なる英語-日本語の翻訳精度がなかなか高まらなかった。精度を0.1%ずつ高めるような状況で、統計的機械翻訳では精度向上の限界が見えていた。

 このため我々は2016年2月、研究の一環で、ニューラルネットワークを使った機械翻訳を試した。

 結果は驚くべきものだった。翻訳の精度が一気に数%高まったのだ。この数字は、機械翻訳の分野では極めて大きなジャンプといえる。

 統計的機械翻訳では、時として読んでも意味が分からない文章が出力される。だがニューラルネット翻訳は、何を言っているかが何となく理解できる、自然な文章を出力する。

 うまくいったときには、人間が書いたとしか思えない文章を出力してくれる。ワオ!ゲームが変わったんだ!と皆、興奮したよ。

 それから8カ月近くをかけて、翻訳する言語ペアごとに学習モデルを作成し、実用化していった。