米Microsoft，音声アプリケーション・サーバー「Speech Server」のパブリック・ベータ版を発表

早坂利之

2003.07.10

　米Microsoftが米国時間7月9日に，音声アプリケーション・サーバー「Speech Server」のパブリック・ベータ版を発表した。「大規模企業とその顧客がより簡単に情報にアクセスできる環境を目指す」（Microsoft社）としている。

　Microsoft社Speech Technologiesグループ部門コーポレート・バイス・プレジデントのKai-Fu Lee氏は，「音声技術はその可能性を発揮する段階に来ている。当社は，この技術の幅広い普及に取り組んでいる」と述べた。

　Speech Serverは「Windows Server 2003」上で稼働する。Windows Server 2003が提供するセキュリティ機能とアーキテクチャを利用し，システム，リソース，ユーザーをセキュリティ侵害の脅威から保護する。また，音声処理向け拡張タグ仕様「Speech Application Language Tags（SALT）」をベースにしており，既存のマークアップ言語を拡張し，音声入力と出力機能を追加する。

　その他の主な特徴は以下の通り。

・「Speech Engine Services（SES）」：
　ユーザーの音声入力を正確に処理する音声認識エンジン「Microsoft Speech Recognition Engine」，記録済みの音声データベースから言葉を組み合わせて人間の声で再生する音声出力エンジン「Prompt Engine」，米SpeechWorksのテキスト読み上げエンジン「Speechify Text-to-Speech Engine」から成る。

・「Telephony Application Services（TAS）」：
　すべての音声インタフェースとをプレゼンテーション・ロジックを処理する「SALT Interpreter」，SALT InterpretersがSESに出したリクエストを処理する「Media and Speech Manager」，SALT Interpreterの各種インスタンスを作成，削除，再設定する「SALT Interpreter Controller」から成る。

　「Speech Serverは，統合テレフォニとマルチモーダル・アプリケーションの両方に対応した唯一の音声サーバーだ。ユーザーは一般的な固定電話や携帯電話だけでなく，PDA，Tablet PC，スマートフォンからでも，音声で情報にアクセスできる」（Microsoft社Speech Technologiesグループ部門ジェネラル・マネージャのXuedong Huang氏）

　また同社は，音声アプリケーションを導入するためのソフトウエア開発キット「Speech Application Software Development Kit（SASDK）」のベータ3版のリリースを同日明らかにした。そのほか，Speech Server関連の開発促進プログラム「Speech Server Beta Program」「Early Adopter Program（EAP）」や開発支援プログラム「Speech Partner Program」なども発表した。Microsoft社によると，米Hewlett-Packard，米Intel，SpeechWorks社をはじめとする40社以上が，Speech Partner Programに申込み済みだという。