ニュアンス コミュニケーションズは音声認識ソフトのエンジンを開発・販売するソフトウエア・メーカー。音声認識ソフトはパソコン向けのパッケージだけでなく,コールセンターなど企業での利用が進んでいるという。通信事業者の採用事例などを西村哲郎ジェネラルマネージャー(写真右)とスピーチディビジョンの田中幸マーケットディレクター(写真左)に聞いた。

(聞き手は大谷 晃司=日経コミュニケーション



音声認識エンジンの市場の状況は。

写真1●ニュアンス コミュニケーションズ ジャパンの西村哲郎ジェネラルマネージャーと田中幸スピーチディビジョン マーケットディレクター
写真1●ニュアンス コミュニケーションズ ジャパンの西村哲郎ジェネラルマネージャー(写真右)と田中幸スピーチディビジョン マーケットディレクター(写真左)
 米ガートナーの2005年度の調査では,ニュアンス コミュニケーションズ(合併前会社を含む)のシェアは70%を超えている。コールセンターの利用も多い。ワールドワイドでは約2000社が採用しており,日本では約200社に上る。三菱UFJ証券,ANA(全日本空輸),ソニーなどのコールセンターで使われている。

 ニュアンス コミュニケーションズは,パソコンにインストールして使うパッケージ製品だけでなく,電話機やカーナビゲーション・システムに組み込む音声認識エンジンを開発している。また,コールセンター向けの音声認識エンジンも提供している。コールセンターでの使い方としては,例えば証券会社の場合は,顧客に電話口で銘柄名を言ってもらい,その名前を認識して株価をアナウンスする,といったものだ。実際に,ANAは会員向けサービス用のフライト情報やチケット予約システムで,空港名の認識に音声認識エンジンを活用している。

コールセンター向け音声認識エンジンの特徴は。

 事前の音声登録が不要で,不特定話者の音声認識が可能な点が一般のエンジンとは異なる。また,例えばIP電話や携帯電話などの回線種別に関係なく,認識率が高い点も特徴だ。住所などは50万通りの言い方があるそうだが,それらも実用レベルで既に認識できている。拡張性や安定性も評価されており,米国の証券会社では6000回線,ブラジルの通信事業者では8000回線の事例もある。

 音声認識だけでなく,音声合成技術を組み合わせて使う事例もある。「カスタム・ボイス」という特定の人物の声の特徴を出せる機能である。あるタレントをイメージ・キャラクタとして採用している企業のシステムの場合に,電話の応答音声をそのタレントの声にできるものだ。タレントの実際の声をいくつかサンプリングし,音声を合成することで実現する。日本では採用事例はまだないが,米国では既に事例がある。

 このカスタム・ボイスは,変わったところではホンダ(本田技研工業)の二足歩行ロボット「ASIMO」の英語の声に使われている。アメリカ人の男の子をベースに音声合成を使って開発した。

 音声認識や音声合成の技術はどんどん進化している。日本で2007年秋にリリースする予定の新しい音声認識/合成エンジンは,エラー率をこれまでのエンジンよりも約28%低減させた。音声認識エンジンを稼働させるためのCPU使用率も約21%低減できる。

通信事業者の導入事例を教えて欲しい。

 日本ではあまり一般的ではないが,米国の事例に「音声ダイヤル」というサービスがある。これは相手の名前を発話して電話をかけることができるサービスだ。米国の携帯電話事業者であるスプリント・ネクステルが提供している。具体的には,特番に電話をすると「誰に電話しますか」と聞かれる。ここで「誰々」と名前を言うことでダイヤルすることができる。

 このサービスの利点は,相手の電話番号を複数登録しておけば,最初にかけた番号が不在でも,他の番号に自動的にかけてくれること。さらに,セキュリティを保つのに非常に有効であることも利点として挙げられる。なぜなら携帯電話機側に電話帳を持つ必要がないからだ。個人の電話帳は通信事業者側のサーバーで管理する。サーバーの電話帳へは,携帯電話から音声認識を使って声で登録することもできるし,専用のWebページから登録することもできる。

 このサービスは携帯電話事業者にとってもメリットがある。ユーザー個人のデータを管理・登録することになるので,他事業者への乗り換えを防げるからだ。個人用途ではなく,企業が社内電話帳システムと連動するサービスも提供している。また,大企業では独自で同種のシステムを構築した例もある。

 海外のコールセンターでは,自由発話による「呼の振り分け」も導入されている。音声認識した内容からキーワードをピックアップして,あらかじめオペレータに知らせるような仕組みを作れるわけだ。IVR(interactive voice response)と音声認識エンジンが連動し,そこからCTI(computer telephony integration)に情報を受け渡す。例えばベル・カナダでは120もの振り分け先があるが,実際に顧客がかける電話番号は一つだけだ。顧客とオペレータの両者にメリットがあり,日本でも通信事業者や大規模なコールセンターを運用しているところでは有効だろう。