Web関連技術の標準化を進めるWorld Wide Web Consortium(W3C)は,XMLベースの音声合成向け記述言語「Speech Synthesis Markup Language(SSML)1.0」をW3C勧告(Recommendation)として公開した。W3Cが米国時間9月8日に明らかにしたもの。SSMLを使用すると,発音,音量,高さなど音声合成の重要な要素を細かく制御可能となり,Webで高品質な音声合成を利用できるという。

 W3Cは,「Web上の音声機能を強化しようとすると,発音が大きな問題になる」と指摘する。「たとえば,“1/2”という文字列はどのように発音するだろう? 文脈が与えられないと,“2分の1”,“1月2日”,“2月1日”,“1割る2”のどれになるか判断できない」(W3C)。SSML 1.0は,このようなあいまい性を解消するための仕様である。

 SSMLで定義されているボキャブラリは,単語/音素/波形レベルで音声合成出力を制御できる。その結果,さまざまなアプリケーション・シナリオやオーサリング条件を満足できるという。「パソコンと同様に電話からもアクセス可能なWebページの作成が可能となる」(W3CディレクタのTim Berners-Lee氏)

 SSMLの策定は,W3C Voice Browser Working Groupが行った。参加企業/組織は以下の通り。

 米Aspect Communications,米BeVocal,米Brooktrout Technology,キヤノン,米Comverse Technology,米Convedia,米Electronic Data Systems,フランスFrance Telecom,米Genesys Telecommunications Laboratories,米HeyAnita,日立製作所,米Hewlett-Packard(HP),米IBM,米Intel,IWA-HWG,Korea Association of Information and Telecommunication,イタリアLoquendo,米Microsoft,MITRE,三菱電機,米Motorola,フィンランドNokia,米Nuance Communications,米Openstream,ドイツSAP,米ScanSoft,ドイツSiemens,米Sun Microsystems,米Syntellect,米Tellme Networks,米Verascape,米Vocalocity,カナダVoiceGenie Technologies,米Voxeo,アイルランドVoxpilot。

 なお,同ワーキング・グループのメンバーのうち,以下の企業/組織は既にSSML 1.0の実装を終えている。

 Aspect社,France Telecom社,HP社,IBM社,Loquendo社,Microsoft社,MITRE,Nuance社,SAP社,ScanSoft社,Sun社,VoiceGenie社,Voxeo社,Voxpilot社。

◎関連記事
W3C,Web向け音声タグ仕様「VoiceXML 2.0」と音声認識文法仕様「SRGS」が完成
業界団体VoiceXML Forum,W3C勧告候補「VoiceXML 2.0」のサポートを表明
米IBMとホンダ,カーナビ向け音声合成/認識システムを共同開発
WebブラウザOperaが音声で操作可能に,米IBMの音声技術を統合
米Microsoft,音声認識ソフト「Voice Command」の機能と販売を強化
米HPがVoiceXML技術のスウェーデンPipeBeachを買収,「音声対応製品を強化」
ライコス,KDDIの携帯電話サービス向けの検索サイトに音声認識技術を導入
情報アクセシビリティ

[発表資料へ]