口パクで音声入力できるマスク、東大などが開発 約8割の精度で音声を認識:Innovative Tech
東京大学と産業技術総合研究所の研究チームは、マスク着用時に口パク(無声発話)による音声入力が行えるマスク型デバイスを開発した。口パクによって変形するマスクを内蔵するセンサーで読み取り、音声アシスタントへの入力コマンドに変換する。
Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
東京大学と産業技術総合研究所の研究チームが開発した「E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors」は、マスク着用時に口パク(無声発話)による音声入力が行えるマスク型デバイスだ。口パクによって変形するマスクを内蔵するセンサーで読み取り、音声アシスタントへの入力コマンドに変換する。
E-MASKでは、口元の動きによるマスクの変形を計測するために、曲がり具合を検出できる柔軟で高感度なひずみセンサーを利用する。マスク1枚に対して8個のひずみセンサーを用いる。マスクには細長い布をアイロンで熱圧着し8個分のポケットを作る。そのポケットにひずみセンサーをそれぞれ挿入する。そのため、ひずみセンサーの着脱が容易で、日常的に使用するマスクに簡単にセンシング機能を付与することが可能である。
ひずみセンサーの他に、ひずみセンサーの抵抗値変化を測定する回路部分、測定値をノートPCに送るマイクロコンピュータから構成する。現在の回路部分はボックスを首からぶら下げる仕様だが、今後はチップに設計し直しマスクに組み込みたいという。
実験では、Alexaの基本的な操作コマンド21個を推定対象とした。その結果、座位での発話推定精度は84.4%、歩行での発話推定精度は79.1%を示した。
Source and Image Credits: Yusuke Kunimi, Masa Ogata, Hirotaka Hiraki, Motoshi Itagaki, Shusuke Kanazawa, and Masaaki Mochimaru. 2022. E-MASK: A Mask-Shaped Interface for Silent Speech Interaction with Flexible Strain Sensors. In Augmented Humans 2022 (AHs 2022). Association for Computing Machinery, New York, NY, USA, 26-34. DOI:https://doi.org/10.1145/3519391.3519399
関連記事
- 「何かに集中していて、聞き取れなかった音声」を後から再生できるイヤフォン 京セラが開発
京セラ研究開発本部フューチャーデザインラボの研究チームが人間拡張研究の一環として、何かに集中していて聞き逃した音声を後から教えてくれるヒアラブルデバイスを開発した。 - のどの動きをMRIで解析し、口パクをテキストに変換 言語障がい者などのコンピュータ利用の一助に
米カリフォルニア・マーセッド大学の研究チームは、口パク(無声発話)によって動くのどをリアルタイム磁気共鳴画像法(rtMRI)で取得し、その動きから音響情報を理解してテキストに変換する深層学習フレームワークを開発した。 - 読唇術で音声入力 スマホで口パクを自撮りし音声に変換「LipType」
声を出さずに音声入力するための新しい手法。 - 口パクの顎の動きで音声認識 イヤフォンに後付け可能
声を出さない音声入力が可能に。 - 「サーバに致命的な不具合」のスマホゲー、「修正不可能と判断」でそのままサービス終了 問題発生から2日で
ゲームの開発・運営を手掛けるインゲームは、スマートフォンゲーム「戦策三国志」(iOS/Android)の不具合を修正できず、サービスの提供を終了したと発表した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.