ITmedia NEWS > STUDIO >

ヤフー、音声認識にディープラーニング導入 騒音下での認識精度向上

» 2015年05月19日 19時24分 公開
[ITmedia]
photo Yahoo!音声アシスト

 ヤフーは5月19日、スマートフォンアプリの音声検索機能などに利用している自社開発の音声認識エンジン「YJVOICE」にディープラーニングを導入した。雑音やノイズがある場所での認識精度が大幅に改善したという。

 ディープラーニングは、脳神経細胞の動きをモデル化し、膨大なデータを学習させることで対象を人工知能に判断させるという機械学習手法の1つ。Google、Facebook、Twitterなども相次いで技術開発や企業買収を行い、注目を集めている。ヤフーは、検索で蓄積したデータの活用を目指し2013年に研究を開始した。

 新エンジンは「Yahoo!音声アシスト」「音声検索」をはじめ、カーナビや地図、乗換案内など18のスマホアプリやウィジェットに導入する。人が発声している音声区間を検出する精度が高まり、人混みや駅のホームなど、周囲にノイズが多い場面での認識率が向上し、これまで誤認識していたケースの3分の1で改善が見られるという。

動画が取得できませんでした
photo YJVOICEのシステム構成とDNN実装範
photo 音声区間検出を用いた音声認識処理の流れ

 音声による入力は、検索での利用はまだ少ないが、両手がふさがることの多い「Yahoo!カーナビ」での利用率は15〜20%にのぼる。データ&サイエンスソリューション統括本部の三宅純平さんは「今後デバイスの小型化やIoT(Internet of Things)、ロボットの普及などが進む中で、キーボード以外の文字入力が重要になっていくはず。今すぐ利用を見込むわけではなく未来を見据えた投資」と話す。

 東京工業大学との共同研究を含め、さらなる精度の向上に取り組む。今回は音声認識のみへの導入だが、今後画像検索や広告分野での利活用も目指す。

Copyright © ITmedia, Inc. All Rights Reserved.