au携帯で「声で乗換検索」が可能に〜分散型音声認識機能「声de入力」

» 2006年01月12日 11時29分 公開
[杉浦正武,ITmedia]

 →地名や乗換を声で入力・検索「声de入力」の実力は?

 →au「声de入力」は、今までの音声認識とどこが違う?

 KDDIは2月上旬から、au携帯に分散型音声認識機能「声de入力」機能を搭載すると発表した。ナビタイムジャパンとの協業で、歩行者向けナビゲーションサービス「EZナビウォーク」で同機能を提供する。ユーザーは文字入力せずとも、画面を見ずに発声するだけで乗換検索や、目的地検索が可能となる。

Photo 「発声してください」というガイダンスに従って出発・到着駅、日時などを発声すると、認識結果が表示される。検索ボタンを押せば乗換検索結果が表示される

 2月上旬に発売予定のEZナビウォーク対応au携帯から、順次対応する予定。音声認識機能を携帯電話側とサーバ側に“分散配置”しており、処理を分担することで少量のパケット送受信で音声認識が可能となる。「こうしたDSR(Distributed Speech Recognition)型の音声認識機能を、いわゆるスマートフォン以外の携帯で実現するのは世界初」(KDDI)

 料金はパケット通信料のみ。ただし「声で乗換検索」を利用するにはEZナビウォークの有料登録が必要となる。EZナビウォークの利用料金は95円/24時間、210円/月、道路情報や鉄道運行情報も利用できるコースが315円/月。

KDDI研究所の技術を採用

 今回の分散型音声認識機能では、携帯電話側でユーザーの発声した音声の特徴情報を抽出してデータ網経由でサーバ側に送信し、サーバ側で音声認識処理を行うといった処理を行っている。

 「従来の携帯搭載型の音声認識では、端末の処理能力の制約から数十単語程度しか認識できなかった。高性能なサーバを利用すれば、大規模かつ最新の情報に基づく音声認識を高精度で実現できる」

 これまで音声認識で不満を感じることが多かった部分にも改良を加えた。音声認識を開始する直前に周辺雑音を測定し、ユーザーの利用環境に適した音響分析処理を行ったり、誤った認識結果である可能性がある場合にその原因を推定してユーザーに利用法をアドバイスしたりする機能を付加しているという。

 なお、声de入力の商用化にあたってはKDDI研究所が研究開発した音声特徴情報抽出ソフトウェア・音声認識エンジンをもとに、処理能力や信頼性の向上などの改良を加えている。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年06月16日 更新
  1. DAZN「月額980円表記」炎上騒動、沈静化せず 一部ユーザーに公式Xが「やあ!」と返信 火に油を注ぐ事態に (2026年06月14日)
  2. KDDIのpovo、「つながらない」に悩む楽天ユーザーを本気で救済開始か Xで意味深投稿 (2026年06月13日)
  3. あの「カシャッ!」は意味なし? スマホの「シャッター音」実態に即さず、ネットに見直しを求める声 (2026年06月15日)
  4. DAZNは一体「何」を謝罪したのか? “月980円”への直接言及なし…が示すこと (2026年06月14日)
  5. DAZNサッカープラン巡り謝罪、誤解を招く表示あった――「解約のお手続きを承ります」 (2026年06月13日)
  6. iPhone 17 Proで話題になった「8倍光学品質ズーム」って何? そのメカニズムを解説 (2025年12月25日)
  7. シャープが「AQUOS」を中高価格帯へシフトする理由 メモリ高騰が直撃するエントリースマホの限界 (2026年06月13日)
  8. DAZNのW杯「月額980円」表示に落とし穴 ユーザーを困惑させた2つの“ダークパターン”とは (2026年06月12日)
  9. なぜ? マクドナルド「巨大セルフ注文端末」に批判殺到の理由 UI/UXに価格表示まで……直面している課題とは (2026年05月14日)
  10. 「iPhone 17 Pro/Pro Max」、カメラ「光学8倍」は誤解に SNSで指摘が相次ぐ 正しく伝えた競合メーカーは? (2025年09月18日)
最新トピックスPR

過去記事カレンダー