パソコンやスマートフォン(スマホ)に利用者が話しかけた単語や文章などを、テキストに変換し文字入力を実現する技術。音量を上げるなど操作に使われる場合もある。50年近い歴史があるが、ここ数年米アップルや米グーグルなどによって急速に開発が進み、一般的に使われるようになった。

 背景にあるのがクラウドの進化。従来はスマホなど単体で単語などを分析していため、精度や変換速度に難点があった。計算処理能力の高いクラウドの力を借りやすくなったことから、高精度かつ高速な変換が可能になった。こうしたことから最近は、カーナビや家電などに搭載されるなど、すそ野が着実に広がりつつある。

 早くから基礎技術の確立に取り組んできた1社が米ニュアンスコミュニケーションズ。1994年に設立した同社はM&A(合併・買収)で関連技術を次々と取得し、2009年には米IBMから関連特許を譲り受けた。幅広い言語に対応するなど、競合他社を一歩リードしている。日本にも1997年設立のアドバンスト・メディアなど、音声認識関連技術に強みを持つ企業がある。