東芝は独自の音声認識技術などを核にした新たなクラウドサービス「RECAIUS(リカイアス)」を開発。2015年9月30日から10月2日まで東京ビッグサイトで開催している「ITpro EXPO 2015」会場で、新サービスのデモを見せている(写真1)。
RECAIUSは、話し言葉を認識できる音声認識エンジン、感情を込めた朗読が可能な発声エンジン、多言語翻訳など東芝が培った技術を利用したクラウドサービス。第1弾サービスとして「音声ビューワ」の提供を9月1日から始めた(写真2)。
音声ビューワはスマートフォン(スマホ)で拾った会話音声を、リアルタイムでテキスト化するサービス。会議などで各々がスマホを持ってしゃべるようにすると、議事録が簡単に作れる。また登場する言葉の頻度などを視覚化して、会議の内容を把握しやすくできたりする。
スマホの専用のアプリで拾った音声をRECAIUSのサーバーに送り、音声認識を行ってテキスト化する。認識精度は一切チューニングを行わない状態で85%、単語や話し方のくせなどをチューニングする作業を行えば、99%まで高められるとする。認識エンジンは日常会話を認識可能なように改良されており、標準語の会話に現在は対応している。今後は関西弁などの認識もできるような改良も検討している。
音声ビューワの利用料金は、1契約10時間までの音声認識で月額4500円と比較的安価に抑えた。初期費用は不要。また音声認識の機能だけをクラウドで提供するPaaSも用意しており、こちらは10時間の認識で1契約月額1900円で提供する。
東芝はRECAIUSに音声認識エンジンに加え、テキストを感情を込めて読み上げられる朗読エンジンや外国語翻訳エンジン、顔認識エンジンなどを加え、総合的なコミュニケーション支援サービスに育てる考え(写真3)。
まず講演などのテキスト書き起こし支援サービス「音声書き起こしエディタ」、朗読エンジンを使って感情を込めたナレーションを自動生成する「音声クリエータ」(写真4、写真5)、視覚障害者向けのテキストなどの音読資料作成を支援する「音訳エディタ」、コールセンターなどの受付を自動化する「音声対話」、外国語をリアルタイムで翻訳する「同時通訳」といったサービスの提供を計画する。それぞれ11月上旬をめどに、提供を開始できる見込みだ。