最近、初めてのiPadを買った。タブレットの大画面で動画を見たり、読書したりするのはなかなか快適だ。Twitterのタイムラインを眺めるだけでも、スマートフォンで見るより迫力がある。
しかし、文字入力は面倒だ。外付けキーボードも買っていないため、文字入力はもっぱら音声である。Siriを使って天気を聞いたり、端末の設定を確認したりする。
日本では2017年10月に「Google Home」「Amazon Echo」など主要なスマートスピーカーが発売され、音声入力がより身近になった。17年当時は、「日本人の7割が人前で音声検索するのは恥ずかしいと感じている」という調査結果も発表されていたが、そのころに比べると音声入力はだいぶ身近になったと感じる。
当時の記事への反応としてよくあったのが、「外で使うと独り言を言っているように見え、不審者扱いされる」「はっきり発音しないとスマートスピーカーに聞き返されるのでストレス」「OK,googleは使っているが、Hey,Siriは恥ずかしい」「機械に話しかけること自体に抵抗がある」といった声だ。
記者も同じような考えで、当時は「機械に話しかけるのは何だか恥ずかしい」と思っていた。静まりかえった家の中で突然、Google Home miniに向かって「OK,Google 今日の天気を教えて!」と言うのは、日常の中にある“ちょっとした違和感”だった。
それが、いまでは毎日のように「Hey,Siri 天気教えて」(基本的に棒読みだが)などと言っているので、要は慣れなのだと思う。
テレビCMでも、「アレクサ、音楽を再生して」などとスマートスピーカーに話しかける様子が流された。小さいお子さんがいる家庭では、子供がスマートスピーカーに夢中になってしまう例も少なくない。幼少時から「おーけー、ぐるぐる」(反応しない)と話しかけているデジタルネイティブな子供なら、物心ついた時には「音声入力への抵抗」はそもそもないのかもしれない。
「恥ずかしい」という障害は、時代や環境の変化でこれからますます軽減されていきそうだ。記者もまだ外で音声検索をすることには抵抗があるが、いちいちタッチ入力する手間を考えると、ちょっとした調べ物なら音声を使おうという気持ちが強くなっている。
ただし、音声認識の精度については、まだまだ改善を期待したいところだ。ちょっとしたメモ程度には使えるが、記事を執筆するにはまだタイピングの方が効率が良い。最近はイチロー選手の引退会見での「AI字幕」の誤訳も話題になったが、音声の自動テキスト変換には課題も残る。さらに精度が上がれば用途が広がり、音声入力はますます身近なものになっていくだろう。
一方で気になるのが、音声データの取り扱いについてだ。4月11日、米Amazon.comの従業員が「Alexa」の音声記録の一部を聞いていることが米Bloombergの報道で分かった。
こうした行為はAmazonだけが行っているわけではなく、データ管理の設定についても任意で切り替えられる。先述した音声認識の精度向上もそうだが、機能向上のためにユーザーのデータを有効活用するのは仕方がない部分もある。Amazonは今回の件について「顧客のプライバシーを守るために慎重に行っている」と語っている。
むしろ、ユーザーにとって身近なのは、家族間のデータ共有だろう。例えばGoogle Homeでは話しかけた音声データをGoogleホームアプリの「マイアクティビティ」で確認できる。子供が話した内容は全て親が確認できるのだ。「音声入力が恥ずかしい」とは感じなくなったが、そういうリスクがあるというのは心に留めておきたい。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR