Windows 10のInsider Previewで日本語版のCortana(コルタナ)が使えるようになりました。Windows 10の発表時には、「○○さんに××とメッセージを送って」と音声で語りかけると、メッセンジャーアプリが起動、メッセージ本文を自動で入力して送信するというデモが行われました。
Cortanaは、アプリが音声コマンドを登録しておけば、音声で操作できるような仕組みが組み込まれています。また、Androidも6.0になると、Voice interactionという仕組みが組み込まれ、同様に音声でアプリを起動し、ユーザーに音声で質問して必要な情報を得るといった仕組みが作れるようになるといいます。
Amazonが米国で販売しているEchoは、音声でのみ操作する機器で、搭載されているデジタルアシスタントAlexaが音声で操作を受け付けます。このAlexaも最近サードパーティに機能が解放され、さまざまなサービスと連携ができるようになりました。
これまで、スマートフォンでは、音声で検索することが可能で、その後、決まり切った操作なら音声でも操作できるようになりました。しかし、こんどは、スマートフォンそのものを音声で操作できるようになってきたのです。
こうした背景には、機械学習技術などの進歩で音声認識の認識率が向上し、さらに自然言語もかなり正確に理解できるようになってきたことがあります。音声認識機能では、かなりの確率で言ったことをテキストにできるようになってきました。機械学習では、多数のユーザーがこれを使い、それをフィードバックすることで、より精度を高めることが可能です。