声を発することなく音声アシスタント「Alexa」に命令できる技術を、ソニーコンピュータサイエンス研究所が10月23〜24日に開催したオープンハウスで公開した。顎の下に超音波エコー診断装置を当て、「Alexa, play music」と口パクするだけで、Alexaに音楽を流させることができる。
喉元に当てると舌の動きなど口内の様子を捉えられる超音波エコー診断装置を活用。音声コマンドの発話内容と、その時に装置で捉えた口内の画像で機械学習を行い、口内の動きを基に人工音声を合成する。展示では、合成した音声をスピーカーから再生してAlexaを操作するデモンストレーションを披露した。
実際に見てみると、目の前の人は口パクしかしていないのに、少し遅れて後ろから「Alexa, play music」と声がして音楽が流れ出す。仕組みを知らなければ、マジックの1種かと思ったかもしれない。
展示担当者は「音声インタフェースは使いやすいが、必ず音を発さなければならないという問題がある。プライバシーに関わるような内容には利用できない」指摘。さらに大きな問題として、声帯を切除してしまった人など声が出せない人には操作できないことを挙げる。声ではなく口の動きを活用することで、発話が難しい人でも音声操作デバイスを使えるようにする狙いだ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR