米IBMは,VoiceXML対応アプリケーション開発用のアプリケーション・プログラミング・インタフェース(API)を米国時間3月3日に発表した。Eclipse Foundationの音声対応ツール開発活動Voice Tools Projectの一環として開発したもの。

 VoiceXMLは,World Wide Web Consortium(W3C)が策定しているXMLベースのWeb向け音声タグ仕様。文字ではなく音声を使用し,Webコンテンツ/サービスの利用を可能とする記述言語。コンテンツを音声対応ブラウザを介してユーザーの電話機などに伝えるためのレイアウトや構造を定義する。

 VoiceXMLを使用すると,音声合成,音声のデジタル化,音声認識,DTMF(プッシュホンのトーン信号)入力,音声の録音,通話,話者が変わる会話などに対応する音声対話ダイアログの作成が可能になるという。

 Voice Tools Projectは,VoiceXMLのほか,XMLベースの音声認識向け文法記述言語Speech Recognition Grammar Specification(SRGS)などを対象として開発ツールを手がけるEclipse Foundationのオープンソース・プロジェクト。IBMと米Tellme Networksなどが参加している。

 このAPIにより,Eclipse対応ツールでVoiceXMLプラットフォームの利用が可能となる。電話,ハンドヘルド機器,車載機器,Web環境など向けのVoiceXMLアプリケーション導入が迅速化するという。

 またIBMは,同APIに対応したマルチモーダルWebアプリケーション開発ツール「Multimodal Tools Project for Eclipse」の提供も開始した。同ツールを使用すると,XHTMとVoiceXMLを組み合わせたマルチモーダル向けマークアップ言語仕様XHTML+Voice(X+V)でアプリケーションの作成が行える。同社のWebサイトから無償でダウンロードできる。

◎関連記事
「自然な話し言葉でカーナビ操作」,米IBMが音声認識ソフト
米Microsoft,音声認識ソフト「Voice Command」の英国方言対応バージョン
ノルウェーのOpera,声で操作できる電子番組ガイドを発表
米IBM,音声アプリのコンポーネント「RDC」をオープンソース化
W3C,Web向け音声合成記述言語「SSML 1.0」を勧告として公開
W3C,WWW向け音声タグ仕様「VoiceXML 2.0」を勧告案として公開
W3Cが音声認識向け文法記述言語「Speech Recognition Grammar Specification」をW3C勧告候補として発表
W3Cのマルチモーダル標準化を目指す「Multimodal Activity」に対しVoiceXML Forumがサポートを表明

[発表資料へ]