• ビジネス
  • IT
  • テクノロジー
  • 医療
  • 建設・不動産
  • TRENDY
  • WOMAN
  • ショッピング
  • 転職
  • ナショジオ
  • 日経電子版
  • 日経BP
  • PR

  • PR

  • PR

  • PR

  • PR

スマートスピーカーの仕組み

注目浴びるスマートスピーカー、知っておきたい可能性と制約

白石 康司=TIS 2017/12/07 日経SYSTEMS
出典:日経SYSTEMS 2017年10月号pp.48-49
(記事は執筆時の情報に基づいており、現在では異なる場合があります)
目次一覧

 チャットボットに続き、音声でシステムを操作する音声アシスタントに対する注目度が高まってきた。スマートスピーカーの相次ぐ登場は、その象徴といえる。

 チャットボットも音声アシスタントも、実は裏側で使われる技術の多くは共通する。テキストによるコミュニケーションと音声のコミュニケーションの違いを押さえれば、チャットボットと同様に考えられる部分が多い。

 音声アシスタントならではの要素技術は、音声認識(Speech-to-Text)と音声合成(Text-to-Speech)だ。音声認識は、対話システムへの入力がテキストではなくユーザーの声であるため、これをテキストに変換する処理に用いる。

 技術自体は以前から存在するが、最近になって改めて注目が集まってきた。背景には、ディープラーニングによる認識精度の飛躍的な向上がある。正確にテキストに変換しやすくなり、対話システムの実用度が高まった。

 もう1つの音声合成は、対話システムで生成した応答文の結果をユーザーにフィードバックする際に、テキストを音声として読み上げるもの。ただし、通常のテキスト情報では複数の読み方がある言葉を読み間違えたり、アクセントを間違えたりする場合がある。識別できるように、音声合成記述言語のSSML(Speech Synthesis Markup Language)を用いるシステムもある。

音声が新たな可能性を開く

 音声を活用してシステムを構築すると、チャットボットには無い可能性が開ける。一方、音声ならではの制約もある。

あなたにお薦め

連載新着

連載目次を見る

今のおすすめ記事

ITpro SPECIALPR

What’s New!

経営

アプリケーション/DB/ミドルウエア

クラウド

運用管理

設計/開発

サーバー/ストレージ

クライアント/OA機器

ネットワーク/通信サービス

セキュリティ

もっと見る