東芝は2012年2月1日、音声をテキストに書き起こす作業を支援するWebサービス「ToScribe(トゥースクライブ)」のβ版を公開した。同日正午から2012年2月9日正午までに同社サイトでユーザー登録した場合に限り、無料で利用できる。

 ToScribeは、録音した音声データをテキストに書き起こす作業を効率化するための3機能、「自動頭出し機能」「話者分類機能」「整文支援機能」を提供する。

 自動頭出し機能は、作業者が書き起こした文字列と録音データを比較して、録音データ上の文字入力完了位置を特定し、その位置まで録音を巻き戻す機能だ。通常、録音データの再生速度は入力速度よりも速いため、作業者には頻繁に巻き戻しの手間が発生する。同機能を使うと、作業者はEnterキーを押すだけで、次に書き起こしを開始する位置まで録音を巻き戻すことができる。

 話者分類機能は、録音データに複数人の発言が含まれる際に、話し手ごとに録音データを自動分類する。また、整文支援機能は書き起こした文章を自動校正する機能で、文章中の表記のゆれ、誤字・脱字などを検出して通知する。