ヤフーは5月19日、スマートフォンアプリの音声検索機能などに利用している自社開発の音声認識エンジン「YJVOICE」にディープラーニングを導入した。雑音やノイズがある場所での認識精度が大幅に改善したという。
ディープラーニングは、脳神経細胞の動きをモデル化し、膨大なデータを学習させることで対象を人工知能に判断させるという機械学習手法の1つ。Google、Facebook、Twitterなども相次いで技術開発や企業買収を行い、注目を集めている。ヤフーは、検索で蓄積したデータの活用を目指し2013年に研究を開始した。
新エンジンは「Yahoo!音声アシスト」「音声検索」をはじめ、カーナビや地図、乗換案内など18のスマホアプリやウィジェットに導入する。人が発声している音声区間を検出する精度が高まり、人混みや駅のホームなど、周囲にノイズが多い場面での認識率が向上し、これまで誤認識していたケースの3分の1で改善が見られるという。
動画が取得できませんでした
音声による入力は、検索での利用はまだ少ないが、両手がふさがることの多い「Yahoo!カーナビ」での利用率は15〜20%にのぼる。データ&サイエンスソリューション統括本部の三宅純平さんは「今後デバイスの小型化やIoT(Internet of Things)、ロボットの普及などが進む中で、キーボード以外の文字入力が重要になっていくはず。今すぐ利用を見込むわけではなく未来を見据えた投資」と話す。
東京工業大学との共同研究を含め、さらなる精度の向上に取り組む。今回は音声認識のみへの導入だが、今後画像検索や広告分野での利活用も目指す。
関連記事
- Microsoft、OneDriveの写真機能を強化 Bingでの検索やアルバム作成機能
OneDriveにようやくアルバム作成機能が追加された。また、向こう数カ月中にデジカメやUSBスティックからの自動アップロードやディープラーニングによる自動タグ付け+Bing検索機能が追加され、15Gバイトの無料容量追加が実施される(自動アップロードを有効にした場合)。 - Facebook、ディープラーニング開発環境「Torch」向けモジュールをオープンソースで公開
Facebookが、ニューラルネットワーク技術に特化したオープンソースのフレームワーク「Torch」向けのオリジナルモジュールをGitHubで公開した。従来のコードより23.5倍高速としている。 - Google、人工知能応用のシティガイド企業「JetPac」を買収
Googleが買収するJetPacは、数億枚のInstagram画像の解析データを利用するシティガイドアプリやiPhoneのカメラで撮影したオブジェクトを識別するアプリなどを公開しているディープラーニング(深層学習)技術の新興企業だ。 - Twitter、ディープラーニングの新興企業MADBITSを買収 画像検索強化へ
Twitterが、深層学習を応用した画像検索や画像データベース構築に取り組む新興企業MADBITSを買収し、同社の技術をサービスに統合する。 - Facebook、“ほぼ人間レベル”の顔認識技術「DeepFace」を発表
Facebookの人工知能ラボが、「ディープラーニング」技術を使った顔認識技術を発表した。その精度は人間とほぼ互角の識別率97.25%という。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.