ヤフーは2015年5月19日、自社開発の音声認識エンジン「YJVOICE(ワイジェイボイス)」に、機械学習の一手法ディープラーニングを適用し、認識精度を改善させたと発表した。特に騒音下での認識精度が高まったという。YJVOICEを搭載した駅ホームでの「Yahoo!乗換案内」、街頭での「音声検索」などが使いやすくなる(写真)。Yahoo! JAPANのサービスにディープラーニングを実装したのはこれが初めて。

写真●ヤフーによる、騒音下でのディープラーニング適用前(Before)、適用後(After)の音声認識結果。適用後は正しく音声を認識している
写真●ヤフーによる、騒音下でのディープラーニング適用前(Before)、適用後(After)の音声認識結果。適用後は正しく音声を認識している
[画像のクリックで拡大表示]

 ディープラーニングは、多段のニューラルネットワークを使った機械学習の手法。画像中の物体を認識する用途などで威力を発揮する。ヤフーは今回、音声部分の抽出と、「あ」「い」など音素の列を出力する際に活用する音響モデルでディープラーニングを適用した()。

図・ディープラーニングの適用範囲
図・ディープラーニングの適用範囲
[画像のクリックで拡大表示]

 同社は2013年からディープラーニングの研究を始めた。「Yahoo!検索」や「音声検索」などで蓄積したデータをニューラルネットワークに学習させ、認識精度を高めた。東京工業大学の篠田浩一教授との共同研究も寄与しているという。