グーグルは2017年11月9日、スマートスピーカー「Google Home」やAndroid端末などで利用できるGoogleアシスタントのサードパーティ連携機能「Actions on Google」について、説明会を開催した(写真1)。

写真1●グーグルが「Actions on Google」などの説明会を開催(撮影:山口 健太、以下同じ)
写真1●グーグルが「Actions on Google」などの説明会を開催(撮影:山口 健太、以下同じ)
[画像のクリックで拡大表示]

 説明会にはグーグル 製品開発本部長の徳生裕人氏が登壇(写真2)。「Googleアシスタントは2017年8月からiOS向けにも提供し、10月にはGoogle Homeも発売した。現在、世界で1億台以上の端末で利用できる。動画や音楽を再生したいとき、ちょっとした質問をしたいとき、声だけで使えるアシスタントとして開発している」と紹介した。

写真2●グーグル 製品開発本部長の徳生裕人氏
写真2●グーグル 製品開発本部長の徳生裕人氏
[画像のクリックで拡大表示]

 音声アシスタントにおける同社の強みについては、「何が強みになっていくのか分からない部分はあるが、確かに言えることは検索だ。グーグルが構築しているナレッジグラフ、コンテキストの理解、自然言語処理、音声認識技術を活用できるはずだ」(徳生氏)と説明した。

 特に合成音声による読み上げ能力が向上し、より自然になったという。テキストを音声にする従来の技術として、「concatenative TTS(Text-To-Speech)」では「何百時間も声優の声を録音し、うまくつなぎ合わせるもの。五十音だけでは済まず、伸ばす場合などは大変で、不自然さが残るという限界があった」(徳生氏)という。

 それに続く「parametric TTS」についても、「パラメータを抽出して音を出している。何百時間もの録音は不要だが、怒った声などは再計算が必要になった」(徳生氏)と問題を指摘する。