音声アシスタント機能「Siri」は、ヒトの言葉を理解し、指示に従ってタスクを完遂する。Siriがスマホの頭脳となり、自動車への展開も始まっている。ベンチャー企業も、Siriのようなシステムを開発している。この技術をロボットやウエアラブルに応用すると、音声で操作できる。人工知能は大企業だけの技術ではない。

出典: Roland Meertens
出典: Roland Meertens
[画像のクリックで拡大表示]

キーボードを持たないデバイスの操作

 この技術を開発しているのは、「Wit.AI」というベンチャー企業だ。Wit.AIは、ヒトの言葉を解釈し、意図を把握する技術を開発している。いわゆる自然言語解析で、Apple Siriに代表されるように、スマホやタブレットを話し言葉で操作できる。Wit.AIはキーボードを持たないデバイスに特化して技術開発を進めている。

 これらデバイスは音声が唯一の入力モードで、ウエアラブル、自動車、スマート家電、ロボット(上の写真、音声指示に従って立ち上がっている様子)、ドローンなどへの展開を目指している。

 Wit.AIは人工知能クラウドで、「音声認識」(Speech Recognition)と「自然言語解析」(Natural Language Processing)から構成され、利用者の音声指示から意図を解読する。音声認識とは、音声をテキストに変換する技術で、Wit.AIはオープンソースソフトウエア「CMU Sphinx」を利用している。これはカーネギーメロン大学が開発したシステムで、解析の前処理として利用している。自然言語解析とは、非定型な話し言葉を解析し、そこに含まれる命令を把握してマシンが解釈できる形に置き換えるプロセスを指す。