KDDIは2月上旬から、au携帯に分散型音声認識機能「声de入力」機能を搭載すると発表した。ナビタイムジャパンとの協業で、歩行者向けナビゲーションサービス「EZナビウォーク」で同機能を提供する。ユーザーは文字入力せずとも、画面を見ずに発声するだけで乗換検索や、目的地検索が可能となる。
2月上旬に発売予定のEZナビウォーク対応au携帯から、順次対応する予定。音声認識機能を携帯電話側とサーバ側に“分散配置”しており、処理を分担することで少量のパケット送受信で音声認識が可能となる。「こうしたDSR(Distributed Speech Recognition)型の音声認識機能を、いわゆるスマートフォン以外の携帯で実現するのは世界初」(KDDI)
料金はパケット通信料のみ。ただし「声で乗換検索」を利用するにはEZナビウォークの有料登録が必要となる。EZナビウォークの利用料金は95円/24時間、210円/月、道路情報や鉄道運行情報も利用できるコースが315円/月。
今回の分散型音声認識機能では、携帯電話側でユーザーの発声した音声の特徴情報を抽出してデータ網経由でサーバ側に送信し、サーバ側で音声認識処理を行うといった処理を行っている。
「従来の携帯搭載型の音声認識では、端末の処理能力の制約から数十単語程度しか認識できなかった。高性能なサーバを利用すれば、大規模かつ最新の情報に基づく音声認識を高精度で実現できる」
これまで音声認識で不満を感じることが多かった部分にも改良を加えた。音声認識を開始する直前に周辺雑音を測定し、ユーザーの利用環境に適した音響分析処理を行ったり、誤った認識結果である可能性がある場合にその原因を推定してユーザーに利用法をアドバイスしたりする機能を付加しているという。
なお、声de入力の商用化にあたってはKDDI研究所が研究開発した音声特徴情報抽出ソフトウェア・音声認識エンジンをもとに、処理能力や信頼性の向上などの改良を加えている。
Copyright © ITmedia, Inc. All Rights Reserved.