連載
» 2006年01月13日 10時53分 公開

道のりは険しいが、意義深い音声入力UIへの取り組み神尾寿の時事日想

乗換案内や目的地検索の際、声で入力できるauの「声de入力」。入力手段として音声認識は期待したい分野だが、本格的な普及はこれから。より多くの人に使ってもらえるサービスになるために、今後必要なことは何だろうか。

[神尾寿,ITmedia]

 1月12日、KDDIが乗換案内や目的地検索を音声で入力できる「声de入力」を発表した(1月12日の記事参照)。これは同社が以前から開発していたDSRと呼ばれる技術をau携帯電話向けに転用したものだ(1月12日の記事参照)

 筆者も、昨日の発表会で実際に試したが、乗換検索や電話番号入力に関しては、かなり高い精度を見せた。ただし、音声入力システム利用時特有のリズムとイントネーションで話さないと、「ほぼ確実な入力」にならないのも事実。吉岡記者も書いているように「慣れ」は必要だ(1月12日の記事参照)

 声de入力に限らず、「音声入力の難しさ」は、いかにユーザーに慣れてもらうかにある。店頭購入時もしくはサービスの初期利用段階に、ユーザーがトレーニングする仕組みがほしいところだ。

改善の余地が大きい施設名検索

 一方、住所検索や施設名検索では、改善の余地が大きいと感じた。

 まず住所検索であるが、都道府県名や地名までの認識率は高いものの、番地名でつまずくシーンが何度かあった。特に「存在しない住所・番地名」がそのまま誤認識されるのは熟成不足だろう。例えば、音声認識情報が不確かだった場合は、近似する住所地番を「この住所ではありませんか?」と問い合わせてくるような工夫がほしい。

 なお、市町村合併による旧住所については、「当面の間は新住所と併存している」(KDDI)という。

 施設名検索は登録データベースに偏りを感じた。具体的には、レジャー施設や商業施設の音声認識率は高いものの、オフィスビルなどは大きなものでも認識しない事があった。EZナビウォークは「ビジネスユーザーの利用が多い」(KDDI)ということならば、ビジネスユーザーの利用が想定される施設情報も充実させた方がいいだろう。

次期バージョンではGPS連携を

 厳しい意見も述べたが、使いやすい音声入力UIの実現は「困難だが、意義深い取り組み」である。特に携帯電話やクルマなどモバイル環境においては、キー入力ができない・難しい場面がある。自然文認識に踏み込み、au向けのサービスとして市場投入したKDDIの取り組みは評価できる。

 次期バージョンでは、ぜひ「GPS連携」を盛り込んでほしい。例えば、「近くのスターバックス」と話すだけで自動的にGPS情報を取得し、周辺の候補が表示されれば、声de検索がよりダイレクトな使いやすさにつながる。また乗換検索の時に、「近くの駅から東京駅まで」といった指定も、GPS連携ならば可能だろう。

 音声入力UIの難しさと醍醐味は「あいまいさの許容」にあり、その実現において携帯電話のGPSは重要な補完機能になる。GPS分野でリードするauに、ぜひ実現してもらいたい。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセスランキング
  • 本日
  • 週間

    Digital Business Days

    - PR -