「人間が自然に話した言葉の意味をそのまま理解できるシステムの構築が、音声認識の市場を飛躍的に拡大する切り札になる」。こう語るのは、米IBMで音声関連ソリューションを統括するパーベイシブ・コンピューティング部門バイス・プレジデントのジョナサン・プリアル氏(写真)だ。

 コールセンターに対するコスト削減の要求に伴い、自動音声応答システムの需要が高まっている。コールセンター増強時に人件費がかからないからだ。しかし、ほとんどの自動音声応答システムは、決められたルールに従って利用者が単純な単語を発声するという仕組みに頼っている。顧客に「システムに合わせてもらう」という作業を強いているのが現状だ。

 プリアル バイス・プレジデントは「自然言語を理解する仕組みをコールセンターに導入すれば、顧客はより自由に色々なことを話せるようになる。当然、音声認識システムが処理できる範囲も広がる」と主張する。その例としてプリアル氏が挙げるのが、米大手資産運用会社のT・ロウ・プライスが構築したコールセンターだ。

 T・ロウ・プライスのコールセンターでは、「顧客は何をしたいかを、自由に話せる。あいまいな発言も理解して適切な応答を返すことができる」(プリアル氏)という。例えば、顧客が同社に電話をかけて「僕の持っている株は?」と聞くと、「A社、B社、C社です」といった具合に答えが返ってくる。ここで顧客が、「2番目の値段は?」と問いかけると、システムはB社のことだと判断して、「B社の株価は15ドルです」と答えるといった具合だ。

 「これは、自然言語の理解技術をシステムに導入することで、より自然な会話ができるようになるという一例だ」とプリアル氏は説明する。「自然言語理解技術を活用して自動音声応答システムを作れば、顧客に与えるストレスが少なくて済む」(同)。

 T・ロウ・プライスのシステムは、IBMの音声認識、合成、自然言語理解の機能を備える「WebSphere Voice Server」を利用して構築した。日本IBMは同製品の最新版を日本語化して、来年前半に国内市場に投入する予定だ。

(広岡 延隆=日経コンピュータ)