検索は“キーを押して話すだけ”――Nuanceの音声認識でケータイ操作はこう変わる

» 2008年12月02日 07時00分 公開
[後藤祥子,ITmedia]
Photo 米Nuance Communicationsのエバンジェリストで業界渉外担当のマイケル・ウィヤーズ氏

 携帯電話は今や、通話やメールのためのツールから、インターネットやテレビ、音楽を楽しめるマルチメディアツールへと進化し、ユーザーは時間や場所を選ばずさまざまな情報を得られるようになった。

 しかし、こうした多機能化は、“使いたい機能を見つけられない”“操作手順が複雑で分かりづらい”というユーザビリティ上の問題を生み出したため、通信キャリアや端末メーカーが対応に頭を悩ませている。

 こうした使い勝手の問題を解決する1つの手段として米Nuance Communicationsが提案するのが、ハイエンド端末向けの文字入力システム「XT9」と端末内外の機能やコンテンツを検索するためのシステム「T9Nav」だ。

 同社のエバンジェリストで業界渉外担当のマイケル・ウィヤーズ氏が、XT9、T9Navを組み込むことで、携帯電話の操作性がどう変わるかを説明した。

声でメールを起動、タッチパネルでミスの少ない入力

 米Nuance Communicationsは、音声や画像認識技術を軸としたサービスを手がける企業で、同技術を利用した医療用カルテや電子処方せんからDragon NaturallySpeakingなどのパッケージ製品、法人向けのコールセンター向け音声ソリューションに至るまで、音声認識を生かしたさまざまな製品を提供している。

 同社は2007年8月、文字入力システム「T9」「XT9」の開発を手がけるTegic Communicationsの買収を機に、携帯電話向けユーザーインタフェース開発分野に参入。携帯電話向け音声インタフェースソリューションの1つであるVSuiteと、端末内の機能や電話帳などのコンテンツ、ネット上のコンテンツを検索可能にするT9Navを組み合わせたサービスを検討中だ。

 ウィヤーズ氏は、VSuiteとT9Nav、多彩な入力方式に対応するXT9を組み合わせることで、携帯電話をより効率よく操作できるようになり、それが新たな使い方の発見にもつながると話す。

 3製品の組み合わせで実現するのは、例えばこんな使い方だ。

 「端末の音声認識キーを押し、マイクに向かって『○○さんにテキストメッセージを送る』と話すと、その相手のメールアドレスが入力されたメールの新規作成画面が起動する(VSuiteとT9Navのコンビネーションによる動作)。この端末がタッチパネル対応なら、入力画面に触れるだけでXT9のソフトウェアキーボードが起動し、少ないキー操作でテキストを入力できる」(ウィヤーズ氏)

 現在の音声端末で、相手のメールアドレスが入力された状態の新規メール作成画面を出すには、最短でも[メールキーの長押し]→[Toを押す]→[入力方式の選択]→[送受信履歴から相手を選択]といったキー操作を行う必要がある。しかしこのアプリケーションを使えば、「音声認識キーを押して、命令するだけ」で済む。

  • ↓声で新規メール作成画面を起動

Get Macromedia FLASH PLAYER このムービーをご利用いただくためにはFLASHプラグイン(バージョン8以上)が必要です。

 “声でメールを起動”したあとは、文字入力システムXT9の出番だ。XT9は、最近のトレンド機能として注目を集めるタッチパネルによる文字入力にも対応し、ソフトウェアキーボードで入力ミスを減らせる仕組みを用意した。

 タッチパネル上に表示されたキーボードは、見る角度を変えると光の角度が変わり、キーの位置がずれて見える場合がある。XT9は、こうしたキーの見え方による入力ミスをも修正する機能を備えており、「“ここにある”と思っているキーが、実は違うところにあったということもある。XT9は、こうした入力間違いを修正する」(ウィアーズ氏)という。

 これは、(1)キーの間の距離を把握する機能(2)単語の予測機能 の組み合わせで実現しており、「例えば、ある文字を入力したものの、その文字では単語として成立しない場合には、その近くにあるどのキーを押すと単語ができるかを探し、その単語に修正する」(ウィアーズ氏)という動作を端末内で行う仕組みだ。

Photo タッチパネル上のソフトウェアキーボードは、見る角度によってキーの位置がずれて見える場合があるが、XT9はこうした入力ミスを修正する

 T9NavとVSuiteを組み合わせた“音声による機能の呼び出し”と、XT9を使ったタッチパネル上でのミスの少ない文字入力はほんの一例で、機能の使い方次第で「ターゲットユーザーに合わせた、さまざまなカスタマイズができる」とウィヤーズ氏は自信を見せた。

キーを1回押すだけでローリング・ストーンズの音楽を検索

 Nuanceは、T9Navとの連携を強化した音声認識機能の提供も検討中で、次のバージョンでは“電話帳から任意の相手を呼び出して電話をかける”といった単純なコマンドだけでなく、より詳しい情報を声で検索可能にする仕組みを導入する計画だ。

 「例えば、端末のマイクに『ローリング・ストーンズの音楽を探す』と話せば、自動でWebに接続し、コンテンツを探してストリーミング再生するような使い方ができる。検索語をダイヤルキーで入力する場合には、何度もキーを押さなければならないが、音声なら音声機能を起動するキーを押すだけですむ」(ウィヤーズ氏)

 ウィヤーズ氏は「エッフェル塔の高さは」「チーズバーガーのカロリーは」「サンフランシスコのおいしい寿司屋は」「東京からニューヨークまでの距離は」といった質問を端末に対して音声で行い、そのWeb検索の結果を端末の画面上に表示するデモを紹介。これは、音声をテキストに変換して質問の内容を把握し、キーワードを検出するというNuanceの技術で実現しているという。

 なお、音声を使った機能の呼び出しは、Nokiaや富士通などの端末にも実装されているが、ウィヤーズ氏は「Nuanceの技術は、端末内機能と密に連携できる点や、T9との連携で素早く希望のアプリケーションを開ける点がメリットになる」(ウィヤーズ氏)とアピールした。

  • ↓声でWebコンテンツを検索

Get Macromedia FLASH PLAYER このムービーをご利用いただくためにはFLASHプラグイン(バージョン8以上)が必要です。


Photo 「サンフランシスコのおいしい寿司屋は」という質問に対する回答がWebに表示された

 音声認識は端末の処理能力を必要とすることから、高性能なCPUとバッテリーの持ち時間が課題となるが、Nuanceの音声認識はサーバ上でも行えるのが強みで、「端末のバッテリーを余分に消費することなく、音声を使った検索サービスを提供できる」とウィヤーズ氏は説明する。

 「日本は高度な3Gネットワークが普及しており、スピードも速いので、話した言葉を短時間でWeb経由でサーバに送って処理を行い、結果を端末に戻すことができる。そうすることで、バッテリーの消費を最低限に抑えられる。またこの場合は、データベースをサーバに置けることから(端末内の限られたメモリにデータベースを置くのに比べて)豊富な語彙を利用でき、認識能力も上がる」(ウィヤーズ氏)

ユーザーが気がつかなかった機能の発見にもつながる

Photo

 ウィヤーズ氏は、2007年には1億1000万台規模だった音声認識対応端末の出荷台数が、2008年には2億台を超える見込みであるなど、音声認識技術が携帯電話市場で注目を集めていると話す。

 理由の1つは、運転中の通話やメールが規制されている場所での需要が高まっているためで、もう1つは通信キャリアが収益の増加につながる仕組みを求めているためだという。

 「キャリアの中には、ポータルの売り上げが期待ほど伸びていないというところもある。音声認識機能を取り入れることで、利用者はメニューをたどることなく、音声コマンドで必要なコンテンツを探せるようになり、さらに多くのサービスを使ってもらえる可能性が開ける」(ウィヤーズ氏)

 ウィヤーズ氏はまた、携帯電話が多機能化しているにもかかわらず、その多くの機能が使われていないという調査結果を例に挙げ、T9 NavとVSuiteがこうした状況を改善できると自信を見せる。

 「平均的な携帯電話には17以上の機能があり、平均的なユーザーはそのうちの4つの機能しか使っていないという調査結果もある。音声入力を携帯の操作に採り入れることで、利用者は携帯の機能や操作に詳しくなくても、さまざまな機能を発見して使えるようになる。今後は、端末のメニューを見ることなく、端末のフル機能を使えるような機能を実装したい」(ウィヤーズ氏)

 T9NavとXT9は日本語化も順調に進んでおり、すでにそれぞれについて2社の日本の端末メーカーとライセンス契約を結んだという。ワーズ氏は「今後は“音声から始まってテキストで終わる”という操作の事例が増えてくる」と見ており、日本の端末にこうした機能が搭載される日も遠くなさそうだ。

携帯業界のトレンドを知りたいと思ったら→+D Mobile「業界動向」へ
  • 各キャリアの発表会リポート
  • 国内外の携帯市場動向
  • 通信業界のキーパーソンインタビュー
  • 携帯事業者別シェア/携帯出荷台数
  • 携帯関連の調査リポート記事

携帯業界のトレンドや今後を把握するのに必要な記事だけを集めたのが“+D Mobile 業界動向”。記事はトピックや連載ごとにアーカイブされ、必要なときにまとめてチェックできます。
今すぐアクセス!


Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年