“秘書”が耳に住んでいる感覚――「Xperia Ear」が単なるヘッドセットじゃない理由開発陣に聞く(2/2 ページ)

» 2017年01月27日 06時00分 公開
[田中聡ITmedia]
前のページへ 1|2       
※本記事はアフィリエイトプログラムによる収益を得ています

音声認識は使うほど学習する

Xperia Ear 石田氏

 対話をする上で気になるのが、どこまで正確にユーザーの声を認識してくれるのか、という点。設計担当の石田明寛氏によると、Xperia Earの音声認識エンジンは、「SmartBand Talk」や踊るスピーカー「BSP60」の音声認識エンジンを成長させたものだという。開発はソニーエージェントテクノロジーが担当した。

 ユーザーが使うほどにXperia Ear側が学習して、認識精度が上がっていく。しかもサーバ側で定期的に更新するので、他のユーザーにも学習の成果が反映される。「ユーザーさんがいろいろな言い回しをされるので、定期的に改善を掛けています。例えば先月言えなかったことが今月言えるようになる、といった変化はあります」(石田氏)

 しっかりと音声をキャッチできるよう、2つのマイクを搭載したのも特徴だ。石田氏によると、口に近い方の音を強調するように拾っており、口から離れていてもしっかりと認識できるようチューニングした。「クルマが通っている屋外など、騒がしい場所でも使えます」(同氏)

 こうした音声でのやりとりが主な操作法だが、近接センサーと加速度センサーを活用して「うなずき」と「首振り」のヘッドジェスチャーで操作ができるのも、Xperia Earならでは。例えば「電話をかけ直しますか?」「メールの返信をしますか?」と聞かれたときに、首を動かすだけでイエスかノーを表明できる。「音声だけに頼るとインタラクションが冗長になりがちです。ヘッドジェスチャーならイエスとノーを答えるよりもクイックにユーザーの意図を入れられます」(青山氏)

 「重力の方向が変わってもうなずきと認識できる」(近藤氏)ため、例えばベッドで寝そべりながらでも、うなずきと首振りを認識してくれる。青山氏は「“察するアシスタント”といえます」と評する。

声優の寿美菜子さんを起用した理由

 「耳から聞くことしか情報のインタフェースがないので、妥協せず、とことんこだわりました」と青山氏が話すのが、日本語音声の担当者だ。何人かをテストした結果、テレビアニメ「けいおん!」などでおなじみの声優、寿美菜子さんを起用した。なぜ、寿さんに決まったのか。

Xperia Ear 日本語の音声を担当する寿美菜子さん

 Xperia Earの音声は2つの方法で用意した。まず1つが、「接続しました」「バッテリーが少なくなっています」といった、よく使われるフレーズ。こちらは、使用するフレーズをそのまま収録した。

 もう1つが合成音声と生音の組み合わせ。例えばニュースの記事やメールの文章などは事前に録音できないので、合成音声と生音を組み合わせた発話になる。この合成音声+生音の発話が特に自然で心地よく感じられたのが、寿さんだったという。

 実際の収録では、よく使われそうなフレーズに加え、言いそうな言葉を読み上げてもらい、それらを組み合わせて使う。「寿さんには、スタジオにこもってたくさんしゃべっていただきました。収録していない言い回しは苦手になってくるので、そこが見つかったら新たに追加して発話を入れています」(青山氏)

iOSの対応にも期待

 SNSの連携は、LINE/Facebook Messengerの新着メッセージやTwitterの新しい投稿の読み上げ、LINEとFacebook Messengerの返信に対応する。EメールやGmailも通知として表示される部分は読み上げる。石田氏は「読み上げる通知内容が、どれだけユーザーにとって意味があるのかを判断材料にしました」と話す。対応アプリは「増やしたい」(石田氏)とのことなので期待したい。

 一方で気になるのが、対応OSがAndroidのみであること。Xperia Earを普及させるには、日本のスマートフォンで約50%のシェアを持つiPhoneへの対応は必須といえる。この点について青山氏は「現時点ではAndroidをベースに体験を作り込んでいます。iOSについては具体的な回答は差し控えさせていただきます」とコメント。過去には「SmartBand 2」がiOSに対応したこともあるので(関連記事)、今後のアップデートを期待したい。


 スマートフォンの画面を見ずに電話やメールのコミュニケーションができるXperia Earは、これまでありそうでなかった、新しいタイプの製品だ。それだけに、いかに利用シーンや使い方を理解してもらえるかが重要になる。「帰るメール」も、一言ならスマホで文字を打つのも速いし、人前で音声を発するのがちょっと恥ずかしい場面も多い。

 近藤氏は「店頭でなるべく体験を伝えるようにしていますが、音声のやりとりをどう伝えるかに苦心しています」と話す。Xperia Earの“理解者”をいかに増やせるかが、メーカーとしての腕の見せ所といえる。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年