「OK、Google」が認識しやすい話し方は…R25スマホ情報局

» 2016年06月24日 06時00分 公開
[R25スマホ情報局]
R25スマホ情報局

 端末、アプリなど、音声認識に対応したスマホサービスが増えている。しかし、CMでは呼びかけにスムーズかつスマートに反応しているものの、実際には正確に聞き取ってくれないことも…。ひょっとして、自分の声は認識されにくい? 音声認識が“苦手”とする声のトーン、話し方はあるのだろうか。「OK、Google」でおなじみのGoogle社を直撃した。

R25スマホ情報局 ゆっくり、はっきり、わかりやすくがGoogleに話しかけるコツ…?! 写真:cba / PIXTA(ピクスタ)

 「たとえば声が低かったり、早口だったりという理由で認識しないということはありません。人間が聞き取りやすいスピードで、アナウンサーのように滑舌よく話せば判別しやすくなるのは確かですが、とりあえずは気にせずに話しかけてみてください。徐々に認識精度が上がっていきますよ」(Google・プロダクトマネージャー 徳生裕人さん、以下同)

 Googleは2009年から日本語での音声検索サービスを開始。「機械学習」という手法が取り入れられ、過去に検索された音声データを基にして、音声認識システムが自ら学習していくという。データの蓄積に応じて精度が上がるため、開始当初より随分進化している。しかし、苦手とするケースも一部あるようだ。

 「データが少ない方言などは比較的苦手です。また、文脈がある場合は別ですが、『はし(橋・箸・端)』や『あめ(雨・飴)』などの同音異義語は、単語のみで検索しようとすると認識しない可能性があります。さらに、複数の声を聞き分けることはまだ難しいので、2、3人が一気に話しかけると全ての声を拾ってしまい、結果としてエラーになってしまう可能性があります」

 しかし、これらの苦手分野も“機械が賢く”なっていくことによって克服され、よりスムーズに認識するようになるとか。

 「今話題の『ディープラーニング』を取り入れたことで、音声と雑音を上手に切り分けることができるようになり、さらに精度が上がりました。ぜひ一度、雑踏の中などで試してみてください。また、機械に言葉を理解させるための『自然言語処理』技術が向上したことで、『渋谷駅周辺のイタリアン』のように助詞や語句を省略したようなざっくりとした文章を吹き込んでも、渋谷駅近くのイタリアンレストランを検索して表示するなど、理解力は向上しつつあります」

 技術の向上により、“聞き取る力”と“理解する力”を着実に兼ね備えてきているようだ。認識されないとお悩みの方は、まずははっきりと、わかりやすい声で、言葉を吹き込んでみよう。それでももし、正確に認識されなかったとしても、新しいデータとして蓄積されることになる。諦めずにスマホに話しかけていれば、いつか認識してくれるよ うになるかも?

(末吉陽子/やじろべえ)

【取材協力】
Google
http://www.google.co.jp

© RECRUIT HOLDINGS CO.,LTD. all rights reserved.
© Media Shakers Inc. all rights reserved.

最新トピックスPR

過去記事カレンダー

2024年