NECとNECエレクトロニクスは1月26日、携帯電話上で動作する音声認識技術を開発したと発表した。PCやサーバでのデータ処理を必要とせず、携帯電話などの小型機器単体でリアルタイムに動作する。
数千語から数万語の大規模な辞書をもち、普通の会話で使う文章を音声認識できる。「単語レベルで認識精度は9割程度」(NEC)
この技術は、音声認識処理を並列実行させることで実現している。具体的には、1)入力音声と音のモデル類似度の計算 2)音響先読みなど探索範囲の絞り込み 3)絞り込んだ範囲からの最適単語列検索 の3ステップに処理を分割し、3段のパイプライン処理させる。
そのためマルチコアCPUを使うのが前提となる。今回はNECエレクトロニクスが開発した携帯向けアプリケーションプロセッサ「MP211」(9月27日の記事参照)を使って開発を行った。MP211は3つのARMコアを内蔵したCPUで、コア数に合わせてパイプラインも3段とした。
200MHz動作のMP211で単体で音声認識を行うと、音声入力から認識結果までがほぼ瞬時に終了するという。
実際の携帯電話への搭載時期は未定だが、すでに市販のCPUを使って開発を行っており、技術的な課題はほとんどないという。
関連記事
- NECエレ、マルチコア搭載の携帯向けアプリCPU
ARM9コアのCPUを3つ搭載。組込向けCPUでは、初めてのマルチコアプロセッサとなる。対応するOSはLinux。H.264のソフトウェア処理も可能になっている。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.