au携帯で「声で乗換検索」が可能に〜分散型音声認識機能「声de入力」

» 2006年01月12日 11時29分 公開
[杉浦正武,ITmedia]

 →地名や乗換を声で入力・検索「声de入力」の実力は?

 →au「声de入力」は、今までの音声認識とどこが違う?

 KDDIは2月上旬から、au携帯に分散型音声認識機能「声de入力」機能を搭載すると発表した。ナビタイムジャパンとの協業で、歩行者向けナビゲーションサービス「EZナビウォーク」で同機能を提供する。ユーザーは文字入力せずとも、画面を見ずに発声するだけで乗換検索や、目的地検索が可能となる。

Photo 「発声してください」というガイダンスに従って出発・到着駅、日時などを発声すると、認識結果が表示される。検索ボタンを押せば乗換検索結果が表示される

 2月上旬に発売予定のEZナビウォーク対応au携帯から、順次対応する予定。音声認識機能を携帯電話側とサーバ側に“分散配置”しており、処理を分担することで少量のパケット送受信で音声認識が可能となる。「こうしたDSR(Distributed Speech Recognition)型の音声認識機能を、いわゆるスマートフォン以外の携帯で実現するのは世界初」(KDDI)

 料金はパケット通信料のみ。ただし「声で乗換検索」を利用するにはEZナビウォークの有料登録が必要となる。EZナビウォークの利用料金は95円/24時間、210円/月、道路情報や鉄道運行情報も利用できるコースが315円/月。

KDDI研究所の技術を採用

 今回の分散型音声認識機能では、携帯電話側でユーザーの発声した音声の特徴情報を抽出してデータ網経由でサーバ側に送信し、サーバ側で音声認識処理を行うといった処理を行っている。

 「従来の携帯搭載型の音声認識では、端末の処理能力の制約から数十単語程度しか認識できなかった。高性能なサーバを利用すれば、大規模かつ最新の情報に基づく音声認識を高精度で実現できる」

 これまで音声認識で不満を感じることが多かった部分にも改良を加えた。音声認識を開始する直前に周辺雑音を測定し、ユーザーの利用環境に適した音響分析処理を行ったり、誤った認識結果である可能性がある場合にその原因を推定してユーザーに利用法をアドバイスしたりする機能を付加しているという。

 なお、声de入力の商用化にあたってはKDDI研究所が研究開発した音声特徴情報抽出ソフトウェア・音声認識エンジンをもとに、処理能力や信頼性の向上などの改良を加えている。

Copyright © ITmedia, Inc. All Rights Reserved.