ニュース
口パクの「Alexa, play music」で音楽流す ソニーコンピュータサイエンス研究所がデモ公開
声を発することなく音声アシスタント「Alexa」に命令できる技術を、ソニーコンピュータサイエンス研究所が10月23〜24日に開催したオープンハウスで公開した。
声を発することなく音声アシスタント「Alexa」に命令できる技術を、ソニーコンピュータサイエンス研究所が10月23〜24日に開催したオープンハウスで公開した。顎の下に超音波エコー診断装置を当て、「Alexa, play music」と口パクするだけで、Alexaに音楽を流させることができる。
喉元に当てると舌の動きなど口内の様子を捉えられる超音波エコー診断装置を活用。音声コマンドの発話内容と、その時に装置で捉えた口内の画像で機械学習を行い、口内の動きを基に人工音声を合成する。展示では、合成した音声をスピーカーから再生してAlexaを操作するデモンストレーションを披露した。
実際に見てみると、目の前の人は口パクしかしていないのに、少し遅れて後ろから「Alexa, play music」と声がして音楽が流れ出す。仕組みを知らなければ、マジックの1種かと思ったかもしれない。
展示担当者は「音声インタフェースは使いやすいが、必ず音を発さなければならないという問題がある。プライバシーに関わるような内容には利用できない」指摘。さらに大きな問題として、声帯を切除してしまった人など声が出せない人には操作できないことを挙げる。声ではなく口の動きを活用することで、発話が難しい人でも音声操作デバイスを使えるようにする狙いだ。
関連記事
- Alexaに小声で話すと小声で答える「Whisper Mode」、米国でスタート
Amazonのスマートスピーカー「Echo」シリーズに小声で命令すると、小声で答える「Whisper Mode」が米国の英語版で利用できるようになった。 - ほぼ無音の「吸った声」で音声認識 マイクロソフト研究
- 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか
流ちょうな日本語を発声するスマートスピーカー。「こんな音声合成ができるにはあと10年かかると思っていた」と研究者は衝撃を受けている。これを実現したWaveNetとは何か。スマートスピーカーを作る技術がどんなものかを研究者に聞く。 - 「みんなのAI」――ソニーCSLなど新会社 深層学習AIを誰でも教育できるツール公開へ
ソニーコンピュータサイエンス研究所とUEI、米WiLが「みんなAI」をコンセプトにした新会社。手持ちのデータをアップロードするだけで深層学習AIを教育できるという「GHELIA Studio」を公開へ。 - 非接触ICカード型「仮想通貨ハードウェアウォレット技術」、ソニーの技術応用して開発
ソニーのICカード技術を応用した非接触ICカード型の「仮想通貨ハードウェアウォレット技術」を、ソニーコンピュータサイエンス研究所が開発した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.