AlexaがSiriを抜き去った理由:Mostly Harmless(1/2 ページ)
Amazon Echo、Google Homeに続き、AppleがSiri搭載のホームスピーカー、「HomePod」を発表したことでさらなる注目が集まっている“音声認識AIデバイス”市場。その動向をまとめてみると……。
この記事は大越章司氏のブログ「Mostly Harmless」より転載、編集しています。
Appleが6月5日の「WWDC 2017」で、うわさの音声認識AIデバイス「HomePod」を発表しました。
“音声認識AIデバイス”というのは、私が作った造語です。上記の記事では“スマートスピーカー”といっていますが、このジャンルのデバイスは、“音声認識デバイス”とか、“音声認識AI”とか、“音声アシスタントAI”など、メディアによって呼称がバラバラな上に、どれもいまひとつしっくりこないため、私は“音声認識AIデバイス”としてみました。
このジャンルのデバイスとしては、「Amazon Echo」が先行しているといわれています。正確には、「Echo」は製品名で、音声認識AI技術の名称は「Alexa」ですね。
この海外記事では「絶好調」といっていますが、この種のデバイスは日本ではまだ売られていないため、英語圏での評価しか分かりません。日本で発売された場合の反応は日本語の認識精度を含め、海外とはちょっと違うのかもしれません。
音声認識AIで先行したApple
実は、最初に音声認識AIに注目したのはAppleだったのをご存じでしょうか。最初に知るところとなったのは、2011年に「iPhone 4S」で採用された「Siri」です。
2007年に初代iPhoneを発表したとき、スティーブ・ジョブズ氏は、キーボードやスタイラスに変わる理想の入力方式として「指」を採用したとスピーチしました。
タッチスクリーンはその後、スマートフォンの入力方式として標準になりましたが、やはり文字を入力するのは大変です。Siriの登場は、“人間にとって、最も自然な入力方法は「音声」”ということを示唆していたのかもしれません。
伸び悩んだSiri
音声の可能性に気付いたAppleは、Siriを開発したわけですが、当初、認識精度は悪く、ほぼ使い物になりませんでした。
最近は、機械学習のおかげで認識はそこそこになりましたが、頼んだこと(xxを調べてくれ、とか)への対応は、ただその単語をWebで調べただけという感じで、役に立つという印象からは程遠い感じです。
認識精度については日本語と英語の差もあるでしょうが、その先の、“コンテキスト(文脈)を理解して最適な(できればパーソナライズされた)回答を提示する”というAI的な部分については、同じロジックが使えるはずと思いますが、まだ道半ばなのでしょう。
ただ、難しいのは、道端や電車の中でスマホに話し掛けるのにちょっと勇気がいるところ(というか、しませんよね)。Siriも、当初は車の中でのスマホ操作を想定していたのではないかと思います。それに、その後Appleが自動車やテレビ、ウェアラブルデバイスに進出するためには、音声認識AIが必須だったと思いますし、そのための布石だったのだと思います。
実際には、Siriの完成度がいまひとつなこともあってか、Appleのスマートホーム用プラットフォーム「Homekit」や車用の「CarPlay」などに対応した機器はあまり増えていませんでした。iPhoneがあまりに好調だったので、Siriの完成度を上げて音声用の専用デバイスを作るという発想にならなかったのかもしれません。
Appleは、スマートホームのゲートウェイとしてiPhoneを考えていたのでしょう。そこへ殴り込んできたのがAmazonだったわけです。AmazonはAppleとは違い、スマホで手痛い失敗を経験していますから、逆にスマホに変わるゲートウェイを発想できたということなのかもしれません。
関連記事
- 連載:「Mostly Harmless」記事一覧
- Amazon Echoはなぜ、既存のビジネスを食い尽くすのか
今、起こっているデジタル変革はこれまでと何が違うのか、その背景には何があり、これからどのような変化が起こっていくのか。その変化に私たちはどう対応すればいいのか――。斎藤氏の講演から読み解く。 - AIは早くやったやつが勝つ 10分の1の時短を実現したソフトバンクのWatson活用法
Watsonを積極的に活用しているソフトバンクが、「Watson Summit 2017」の基調講演で、自社内でのWatson活用事例を紹介した。特定の業務量が半分になったり、所要時間が10分の1になったりするケースも出ているという。 - リアルデータを巡る戦場でどう戦うか 「新産業構造ビジョン」に見る日本の行方
経済産業省の「新産業構造ビジョン」を読み解き、第4次産業革命の次なる主戦場とされる「リアルデータ」で日本がリードをとるためのポイントを確認しておこう。 - コレ1枚で分かる「操作の無意識化と利用者の拡大」
話しかけるだけで何でもやってくれるスマートなITと暮らす未来がすぐそこに? その普及を支えるインタフェースの進化と、操作に対する人の意識の変化について考察します。
Copyright © ITmedia, Inc. All Rights Reserved.