利用者が発した音声の言語を認識し、別の国の言語に変換して表示または音声で再生するソフト。スマートフォンやタブレット端末向けに相次いで登場している。


 海外出張先で道に迷い、通りかかった現地の人に尋ねたものの、言葉が通じずに困った経験はありませんか。あなたは英語が得意でも、相手もそうとは限りません。とはいえ、全ての出張先の言葉を習得するのは現実的には困難です。

 ところが最近になって、こうした悩みが解消される可能性が見えてきました。利用者が発した言葉を他の言語に翻訳して再生する音声翻訳アプリが、スマートフォンやタブレット端末向けに相次いで登場してきたからです。

 主なアプリとしては、米グーグルの「Google翻訳」や米マイランゲージの「Vocre(ボークレ)」などがあります。NTTドコモも2012年9月まで自社スマートフォン用の音声翻訳アプリを公開し、異なる言語を話す相手と通話できる「通訳電話サービス」を試験提供しました。

効果:簡単なやり取りなら十分

 音声翻訳アプリはスマートフォンなどのデータ通信機能を使って実現しています。具体的には、利用者がスマートフォンに発した音声をまずデジタルデータに変換。これをネット経由で専用のサーバーに伝送します。このサーバーがデジタルデータの内容を認識して機械翻訳を実行。翻訳した内容を、合成音声や文字データに変換して、利用者または通話相手に瞬時に送るという仕組みです。

 大半のアプリは日常会話の簡単なコミュニケーションレベルであれば、既に実用的な水準に達しています。とはいえ、音声認識や機械翻訳の技術は発展途上の段階。現状では音声を認識しやすいように発音したり、翻訳しやすいように文章の順番を意識したりと、利用者側に工夫が求められます。サーバーに多くのデータが蓄積されていけば、翻訳精度の向上が見込めるでしょう。

 リアルタイム性の高いコミュニケーションへの対応が今後の課題といえます。音声認識と機械翻訳、音声合成という3つの処理を実行するには、どうしても時間がかかるためです。

 例外的にNTTドコモの通訳電話サービスは遠隔地の相手とリアルタイム性の高い通話ができるとアピールしています。利用者が音声を発している途中から音声認識や機械翻訳を開始することで、2秒程度で相手に届くようにしているのです。

動向:5人と同時会話できるアプリも

 音声翻訳アプリは利用できる言語の数が急速に増えています。さらに多機能化を図っているアプリもあります。

 例えば情報通信研究機構が2012年7月に公開した「VoiceTra4U-M」は、最大5人が同時に異なる言語で通話やメッセージをやり取りできる機能を搭載して話題になっています。

押さえておきたいITproの関連記事