道のりは険しいが、意義深い音声入力UIへの取り組み:神尾寿の時事日想
乗換案内や目的地検索の際、声で入力できるauの「声de入力」。入力手段として音声認識は期待したい分野だが、本格的な普及はこれから。より多くの人に使ってもらえるサービスになるために、今後必要なことは何だろうか。
1月12日、KDDIが乗換案内や目的地検索を音声で入力できる「声de入力」を発表した(1月12日の記事参照)。これは同社が以前から開発していたDSRと呼ばれる技術をau携帯電話向けに転用したものだ(1月12日の記事参照)。
筆者も、昨日の発表会で実際に試したが、乗換検索や電話番号入力に関しては、かなり高い精度を見せた。ただし、音声入力システム利用時特有のリズムとイントネーションで話さないと、「ほぼ確実な入力」にならないのも事実。吉岡記者も書いているように「慣れ」は必要だ(1月12日の記事参照)。
声de入力に限らず、「音声入力の難しさ」は、いかにユーザーに慣れてもらうかにある。店頭購入時もしくはサービスの初期利用段階に、ユーザーがトレーニングする仕組みがほしいところだ。
改善の余地が大きい施設名検索
一方、住所検索や施設名検索では、改善の余地が大きいと感じた。
まず住所検索であるが、都道府県名や地名までの認識率は高いものの、番地名でつまずくシーンが何度かあった。特に「存在しない住所・番地名」がそのまま誤認識されるのは熟成不足だろう。例えば、音声認識情報が不確かだった場合は、近似する住所地番を「この住所ではありませんか?」と問い合わせてくるような工夫がほしい。
なお、市町村合併による旧住所については、「当面の間は新住所と併存している」(KDDI)という。
施設名検索は登録データベースに偏りを感じた。具体的には、レジャー施設や商業施設の音声認識率は高いものの、オフィスビルなどは大きなものでも認識しない事があった。EZナビウォークは「ビジネスユーザーの利用が多い」(KDDI)ということならば、ビジネスユーザーの利用が想定される施設情報も充実させた方がいいだろう。
次期バージョンではGPS連携を
厳しい意見も述べたが、使いやすい音声入力UIの実現は「困難だが、意義深い取り組み」である。特に携帯電話やクルマなどモバイル環境においては、キー入力ができない・難しい場面がある。自然文認識に踏み込み、au向けのサービスとして市場投入したKDDIの取り組みは評価できる。
次期バージョンでは、ぜひ「GPS連携」を盛り込んでほしい。例えば、「近くのスターバックス」と話すだけで自動的にGPS情報を取得し、周辺の候補が表示されれば、声de検索がよりダイレクトな使いやすさにつながる。また乗換検索の時に、「近くの駅から東京駅まで」といった指定も、GPS連携ならば可能だろう。
音声入力UIの難しさと醍醐味は「あいまいさの許容」にあり、その実現において携帯電話のGPSは重要な補完機能になる。GPS分野でリードするauに、ぜひ実現してもらいたい。
関連記事
- au携帯で「声で乗換検索」が可能に〜分散型音声認識機能「声de入力」
au携帯向けに、音声認識機能を利用し声で入力できるサービスが提供される。発声するだけで目的地検索や乗換案内などが可能。 - 地名や乗換を声で入力・検索「声de入力」の実力は?
「東京から新宿まで10分後」など自然な文章を発声すれば、EZナビウォークを声で操作できる「声de入力」。発表会会場で気になる実力をチェックした。【実動動画を最後に収録】 - au「声de入力」は、今までの音声認識とどこが違う?
単語ではなく、文章を音声認識するためには、現在の携帯電話の処理能力は非力すぎる。auの音声認識サービス「声de入力」が可能になった理由とは? - 時事日想バックナンバー
Copyright © ITmedia, Inc. All Rights Reserved.