Special
» 2012年08月31日 10時00分 公開

ケータイの匠に聞く「しゃべってコンシェル」:「ユーザーがやりたいこと」に答えてくれる――頼れるエージェント「しゃべってコンシェル」 (1/2)

これまでは、やりたいことがあったらユーザーはアプリを起動したり、Webブラウザを立ち上げて検索したりする必要があったが、「しゃべってコンシェル」があれば、話しかけるだけでそれらの行為を実行してくれる。スマートフォンの新しいインタフェースとして普及する可能性を秘めたサービスだ。

[PR/ITmedia]
PR
Photo ジャーナリストの松村太郎氏

 しゃべってコンシェルは、NTTドコモが開発した無料のAndroidスマートフォン向けアプリケーションを利用するクラウドサービスだ。自然言語を認識する機能を備え、自分がやりたいことや疑問に思ったことをスマートフォンに話しかけるだけで、まるでホテルのコンシェルジュのように、さまざまな答えを用意してくれる。また、答えだけでなく、スマートフォンの機能を呼び出したり、時には話し相手にもなってくれたりするのも特徴で、柔軟な対応が可能だ。今回はこのしゃべってコンシェルのすごさと実際にできることを、2人目のケータイの匠であるジャーナリストの松村太郎氏とともにひも解いていこう。

 もしまだしゃべってコンシェルを利用したことがないなら、読み進める前にセットアップすることをお勧めする。アプリのダウンローダがスマートフォンにプリインストールされている場合は、アプリ一覧画面にあるアイコンをタップして「Google Play™」からダウンロードすればいい。そうでない場合はdメニューから「サービス一覧」を開き、「しゃべってコンシェル」にアクセスするとダウンロードできる。

「コンテキスト」を用いて状況に適した情報を引き出す

PhotoPhoto しゃべってコンシェルアプリを起動すると、ドコモのケータイユーザーにはiコンシェルでおなじみのひつじのしつじくんが、「何かご用ですか」と聞いている画面になる。ここで画面下部のマイクのボタンを押し、スマートフォンに話しかけると質問や命令を聞いてくれる

 しゃべってコンシェルは何がすごいのか。この点について松村氏は、「端末が『コンテキスト』を認識して検索などの結果に反映してくれること」だと話す。コンテキストとは、「文脈」「前後関係」などと訳される言葉だが、こういった場面では「判断の材料となる状況や条件」と考えるのがいいだろう。例えばしゃべってコンシェルに行きたい場所を告げると、現在地をユーザーが指定しなくても、スマートフォンがGPSなどから位置情報を取得してルート検索をしてくれるし、現在時刻から最寄駅で乗れる電車の時間なども自動的に判断してくれる。

 「明確に意志を持ってやりたいことが決まっている場合は、しゃべってコンシェルを使うことでその動作が確実に速くなり、効果的です」(松村氏)

 最新バージョンのしゃべってコンシェルでは、自然言語の認識精度も上がり、単純にdメニューから関連のコンテンツを検索して表示してくれるだけでなく、質問をするとその答えをネットから探してくれるなど、コンテンツや機能への導線という役割以上に、ユーザーの操作をサポートする機能が強化されている。やりたいことがあるのに操作方法が分からない、あるいは使いたいサービスがあるのに特定のサービス名やアクセス方法を知らない、といった場合にも、目的に近い答えを瞬時に用意してくれる。

 スマートフォンに詳しい人間にも、しゃべってコンシェルはとても便利だ。しゃべってコンシェルの音声認識機能は精度が高く、キーボードの早打ちで検索キーワードを入力するよりも、話しかけた方が早く検索結果が得られるケースもある。自分の欲求を伝えるだけで答えが得られるという体験は、「Web検索」というもの自体を変えてしまう可能性すら秘めている。

 「これまで、ネット上の情報を検索する場合は、効率よく結果を得るために、ある程度結果を想像しながら、無関係の情報を極力排除できるよう、関連しそうな具体的なキーワードを並べて検索する必要がありました。でもしゃべってコンシェルだと、そういうことを意識しなくても、位置情報や時刻などを自ら補完して、言ってみれば『空気を読んで』、話しかけた内容に対して検索結果を表示してくれます。機械に文章でお願いするという経験はかつてなかったので、ちょっとした気恥ずかしさもありますが、多くの人に“しゃべって理解してもらう”ということを体験してもらいたいですね」(松村氏)

しゃべってコンシェルが得意なこと

Photo アプリソムリエとして活躍する渡部夕貴さん。しゃべってコンシェルのさまざまな反応を試してもらった

 さて、概念の説明が先行してしまったが、しゃべってコンシェルは具体的に何ができるのだろうか。2012年3月のリリース時から、しゃべってコンシェルではユーザーがしゃべった内容を認識し、要望の意図を解釈して最適なサービスや機能を呼び出すことができた。音声を認識してWeb上のコンテンツを検索するのはそれほど珍しくないが、エリアガイドやレシピ情報、地図、天気など、回答を含むWebページの候補を適宜表示できたほか、ニュースやTwitterのツイートを検索することもできた。もちろん電話やメール、カメラ、メモ、スケジュールの登録/検索、アラームの設定、タイマーの設定、音楽再生などのスマートフォンの操作が音声で行えた。

 こうした基本機能の使い勝手が大幅に向上したのが、2012年6月に行われたバージョン2.0.0へのバージョンアップ以降だ。このバージョンアップから、質問に対してクラウド上で推定した「回答そのもの」を表示してくれるようになったのだ。バージョン2.0.0になって、しゃべってコンシェルはよりコンシェルジュらしくなり、単なる音声での検索インタフェースから、エージェントへと進化した。具体的にどのような感じで使えるのかは、アプリソムリエの渡部夕貴さんに実演してもらった。


 現在、しゃべってコンシェルが答えを用意できる具体的なカテゴリは、主に以下の15種類となっている。

カテゴリ 表示
レシピ レシピ情報を表示(クックパッド連携)
乗換 路線情報を表示(dメニュー)
地図 地図情報を表示(dメニュー/ゼンリン連携)
天気 天気情報を表示(dメニュー)
画像 画像検索結果を表示(dメニュー)
Q&A インターネット上の情報などから回答そのものを検索し表示。もしくはWikipediaや教えて!gooでの検索結果を表示
動画 動画検索結果を表示(dメニュー)
音楽 楽曲検索結果を表示(dメニュー)
ニュース ニュース情報を表示(dメニュー)
リアルタイム Twitter情報を表示(dメニュー)
ゲーム ゲームアプリ情報を表示(dメニュー)
アプリ Android™アプリ情報を表示(dメニュー)
本/コミック コミック・書籍情報を表示(dメニュー)
エリアガイド 現在地の「グルメ」「ショップ」「病院」など店舗、施設情報を表示
ブラウザ dメニュー検索のトップにキーワードなしで遷移(dメニュートップ)


 また、しゃべってコンシェルでは、やりたいことを話しかけることで、スマートフォンの機能を呼び出すこともできる。細かな使い方が分からなくても、例えば「写真が撮りたい」といえば、カメラ機能を呼び出すことができる。


カテゴリ 表示
電話 「○○に電話」と言うと、端末にプリインストールされているアプリを利用して電話をかける。アドレス帳に電話番号が登録されている場合のみ利用可能
カメラ カメラやビデオカメラ、バーコードリーダーを起動。バーコードリーダーを起動するには、バーコードリーダーアプリがインストールされている必要がある
タイマー 1時間以内でタイマーを設定
アラーム アラームを設定
スケジューラ登録 スケジュールの新規登録、変更
スケジューラ検索 登録しているスケジュールを表示
メモ メモを作成。SNSアプリ(TwitterやFacebookなど)がインストールされていれば、投稿にも対応
音楽再生 端末に保存されている音楽を再生
メール メールを作成(宛先入力、タイトル入力、本文入力)


       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.


提供:株式会社NTTドコモ
アイティメディア営業企画/制作:ITmedia Mobile 編集部/掲載内容有効期限:2012年9月30日

記事を読んで応募しよう!

Twitterキャンペーンは終了しました。ありがとうございました

「今週のベストコンシェル」

Twitterキャンペーンは終了しました。ありがとうございました