写真1●音の強弱や高低などの「韻律」を解析する
写真1●音の強弱や高低などの「韻律」を解析する
[画像のクリックで拡大表示]
写真2●相づちシステムの基盤モジュール
写真2●相づちシステムの基盤モジュール
(出所:ヤマハ)
[画像のクリックで拡大表示]
写真3●音声対話システムを3社で共同開発する
写真3●音声対話システムを3社で共同開発する
(出所:ヤマハ)
[画像のクリックで拡大表示]

 ヤマハは2016年5月11日、音声対話システムにおいて自然なやり取りを可能にする技術「HEARTalk(ハートーク)」を発表した。人間の発話を解析し、声の強弱や長短といった「韻律」を分析する。これに応じた韻律で音声合成して応答することで、対話システムの不自然さを軽減する(写真1)。第一弾として、HEARTalkの技術を用いて自然な相づちを打つシステムを開発。同日ライセンス提供を開始した。

 HEARTalkは、人間の声の強弱/長短/高低、発話のスピード、間の取り方などの要素から成る韻律を解析する技術。同社が長年培ってきた音声処理技術を応用して開発した。

 同技術を発案した、技術本部 研究開発統括部 新規事業開発部 VAグループの松原弘明企画担当次長は「今の対話システムが不自然なのは、人間の韻律に合わせて応答できないからだ」と話す。現状の音声合成は韻律を考慮しないため、楽しそうな呼びかけに対して低く抑揚のない声で答える、ゆっくり話している人に早口で回答するといった応答をしやすい。相手の韻律を解析し、それに合わせた音声合成をすることで、自然な会話が実現できるとする。

 まず同社が開発したのは、HEARTalkを基に自然な相づちを返すシステム。ソフトウエアをライセンス提供するほか、機器への組み込みを想定したハードウエアも用意(写真2)。玩具メーカーなどに売り込む。

 今後は、HEARTalkを活用した音声対話システムの開発に取り組む。2016年内の商品化を目指して、フュートレック、NTTアイティと共同研究を開始。フュートレックが持つ音声認識エンジンと、NTTアイティの音声合成技術を、HEARTalkと組み合わせる(写真3)。