パナソニックのボイスクラウド構想
パナソニックのボイスクラウド構想
[画像のクリックで拡大表示]
ペンダント型のマイク端末
ペンダント型のマイク端末
[画像のクリックで拡大表示]
寸劇の様子
寸劇の様子
[画像のクリックで拡大表示]
マイクやスピーカーの工夫
マイクやスピーカーの工夫
[画像のクリックで拡大表示]

 International CESでは華やかな展示会場とは別に、ホテルのスィートルームや展示会場の囲われたスペースで展示物を用意している企業も多い。パナソニックもそうした企業の一つ。2014 International CESではメイン会場の2階の会議室の一つを貸し切り、招待者以外に見せない展示物を用意した。

 その展示内容は音声認識を中心に据えたものだった。利用者がペンダント型あるいは腕時計型のマイク「Oto-mate(仮称)」を常に装着。これを通してパナソニッククラウドと呼ぶサーバーシステムと対話を行う。

 展示は個人の家を想定したもので、朝起きてから夜までの一日を寸劇形式で見せた。例えば、起床してきた女性が、「おはよう」と発話すると、パナソニッククラウド側で起きてきたことを判断し、カーテンを開けると共に自動でカーテンを開け「おはよう」と挨拶を返す、「今から出かけるから洗濯やっといて」と語りかけると、「いつも通りの普通モードでいいですか」と聞いてきたりする。音声でパナソニッククラウドに依頼することで、クルマのエンジンを掛けたり、戸締まりもできたりする。この他、レストランを探す寸劇では、検索のために必要な発話者からの情報が足らず、「料理の種類は?」などコンピューター側が検索のために必要な情報を積極的に聞き返していた。

 このデモで示したのは、個人の家だったが、現時点ではむしろビジネス向けの使い道で開発を進めたい意向を持っているようだ。具体的には自動車向け、医療向け、航空機向けといった分野である。「ビジネス向けは家庭と違って利用シーンが明確なので、音声認識の確率を上げやすい」(説明員)のが一つの理由だ。

 また、マイクをわざわざ用意したのは、「音声認識が入力の音の品質によって認識率に大きな差が出るから」(説明員)だという。現在の音声認識技術は静かな環境であれば、90%を超えるような非常に高い精度で認識できる。しかし、周囲の雑音などでS/N(信号対雑音比)が下がると、一気に認識率が落ちる。そこで風や振動などのノイズが載りやすいデジタル・ビデオ・カメラの技術を使用して、明瞭な音を捉えられるマイクを新たに開発した。また、ユーザーからの問いかけに対して、聞きやすい音で応答を返せるようにスピーカーも工夫した。再生音がユーザーのように向くように構造を工夫したり、人の声が聞きやすいようにスピーカーで再生する周波数を低い方向に拡張したりしている。

 今後は、展示に興味を持った企業と、新サービスを一緒に開発していきたいという。