検索
ニュース

口パクで音声入力できるマスク、東大などが開発 約8割の精度で音声を認識Innovative Tech

東京大学と産業技術総合研究所の研究チームは、マスク着用時に口パク(無声発話)による音声入力が行えるマスク型デバイスを開発した。口パクによって変形するマスクを内蔵するセンサーで読み取り、音声アシスタントへの入力コマンドに変換する。

Share
Tweet
LINE
Hatena

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 東京大学と産業技術総合研究所の研究チームが開発した「E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors」は、マスク着用時に口パク(無声発話)による音声入力が行えるマスク型デバイスだ。口パクによって変形するマスクを内蔵するセンサーで読み取り、音声アシスタントへの入力コマンドに変換する。


(a)柔軟で高感度なひずみセンサー、(b)ひずみセンサーをマスクに取り付ける様子、(c)E-MASK装着時の正面図

 E-MASKでは、口元の動きによるマスクの変形を計測するために、曲がり具合を検出できる柔軟で高感度なひずみセンサーを利用する。マスク1枚に対して8個のひずみセンサーを用いる。マスクには細長い布をアイロンで熱圧着し8個分のポケットを作る。そのポケットにひずみセンサーをそれぞれ挿入する。そのため、ひずみセンサーの着脱が容易で、日常的に使用するマスクに簡単にセンシング機能を付与することが可能である。


センサーの配置とセンサーデータ

 ひずみセンサーの他に、ひずみセンサーの抵抗値変化を測定する回路部分、測定値をノートPCに送るマイクロコンピュータから構成する。現在の回路部分はボックスを首からぶら下げる仕様だが、今後はチップに設計し直しマスクに組み込みたいという。

 実験では、Alexaの基本的な操作コマンド21個を推定対象とした。その結果、座位での発話推定精度は84.4%、歩行での発話推定精度は79.1%を示した。

Source and Image Credits: Yusuke Kunimi, Masa Ogata, Hirotaka Hiraki, Motoshi Itagaki, Shusuke Kanazawa, and Masaaki Mochimaru. 2022. E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors. In Augmented Humans 2022 (AHs 2022). Association for Computing Machinery, New York, NY, USA, 26-34. DOI:https://doi.org/10.1145/3519391.3519399



Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る