ITmedia NEWS > 科学・テクノロジー >

“マスク”を“マイク”にするクリップ「MaskClip」 東大などが開発 医療現場などでの活用に期待Innovative Tech

» 2025年11月04日 08時00分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

X: @shiropen2

 東京大学とソニーCSL京都に所属する研究者らが発表した論文「MaskClip: Detachable Clip-on Piezoelectric Sensing of Mask Surface Vibrations for Real-time Noise-Robust Speech Input」は、既存の使い捨てマスクに取り付けるだけでピンマイクにする小型クリップ「MaskClip」を提案した研究報告だ。騒がしい環境でも話者の声だけを正確に捉えることができる。

使い捨てマスクに取り付けるだけでマイク化できるデバイス

 マスクが日常生活の一部となった現代において、音声コミュニケーションの質の低下は深刻な問題となっている。特に医療現場や産業施設のような騒音環境では、マスクによる音声減衰と環境騒音が相まって、効果的な意思疎通が困難だ。MaskClipはこの障壁を取り除き、マスクを着用したままでも高品質な音声入力を可能にする。

 MaskClipは、圧電センサーを用いてマスク表面の振動を検出することで、着用者の音声のみを選択的に収録。従来のマイクロフォンが空気中の音波を全て拾うのに対し、圧電センサーはマスク表面に伝わる振動のみを検出するため、周囲の騒音を物理的に遮断できる。

話した際のマスク表面の振動を捉えることで着用者の音声のみを収録

 デバイスの設計において重視されたのが衛生面への配慮だ。クリップでマスクに簡単に着脱できる構造により、マスクの交換や洗浄を妨げることなく、感染対策を維持しながら使用できる。これは医療現場のような厳格な衛生管理が求められる環境において重要な要素だ。

 研究チームは実環境を想定した評価実験を実施。LibriMixとWHAM!データセットを用いて、複数話者の音声と背景騒音が混在する状況を再現し、音声認識性能を測定した。結果、MaskClipは騒音環境下で文字誤り率6.1%を達成し、従来のピンマイクの19.7%と比較して大幅な改善を示した。さらに102人の参加者による主観評価では、騒音環境での通常音声でMaskClipが高いスコアを獲得し、従来マイクのスコアを上回った。

 この研究は、CEATEC AWARD 2025においてデジタル大臣賞を受賞している。

Hirotaka Hiraki and Jun Rekimoto. 2025. MaskClip: Detachable Clip-on Piezoelectric Sensing of Mask Surface Vibrations for Real-time Noise-Robust Speech Input. In Proceedings of the Augmented Humans International Conference 2025(AHs ’25). Association for Computing Machinery, New York, NY, USA, 333-344. https://doi.org/10.1145/3745900.3746088



Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

あなたにおすすめの記事PR