このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
米ワシントン大学と米Microsoft、AssemblyAIなどに所属する研究者らが発表した論文「Hearable devices with sound bubbles」は、数メートル範囲で見えない防音空間(論文ではサウンドバブルと表現)を作れるAIヘッドフォンを提案した研究報告である。
このAIシステムは、装着者の周囲にバーチャル的な防音空間を作り出し、防音空間内外で音の選択的な制御を行い、その中にいる人(最大2人)の声だけを聞こえるようにする。この防音空間は、半径約1〜2mの範囲での大きさを自由に設定でき、外にある音源からの音を49dBも低減できる。
研究チームは、この技術を実現するために市販のノイズキャンセリングヘッドフォンを基に試作機を開発した。ヘッドバンド部分に6個の小型マイクを配置し、小型の組み込みコンピュータを搭載している。
この技術が機能する仕組みは、まずヘッドフォンのマイクが音を立体的に検知し、音が装着者の頭に当たって反射する際の変化も含めて情報を収集する。システムはマイク間での音の到達時間の差と強さの違いを分析し、これらの情報を組み合わせることで音源までの距離や方向を判断する。コンピュータ上で動作するニューラルネットワークが、各マイクに到達する音を極めて短い時間で分析し、防音空間範囲内にある話者の音声だけを抽出する。
(関連記事:囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群)
システムの開発過程で研究チームは、実際の使用環境での性能を確保するために、データ収集と学習を行った。22種類の異なる室内環境(オフィス、居住空間、会議室、教室、研究室など)で、マネキンと実際の人間の両方を使って、合計約15時間の音響データを収集した。
さらに、装着者の頭の大きさの違いや、それに伴うマイクの位置のわずかな変化、さまざまな環境ノイズなどにも対応できるよう、データ拡張技術を用いて学習データを強化した。その結果、システムは未知の環境や初めての装着者に対しても安定した性能を発揮できるようになった。
具体的な使用シーンとして、騒がしいレストランで自分のテーブルの会話だけを聞きたい場合や、複数の会話が飛び交う会議室で特定のグループの討論だけに集中したい場合などを想定。また航空機内では、周囲の雑音や他の乗客の会話を遮断しながら、サービスで近づいてきた客室乗務員の声だけを聞くことも考えられる。
Source and Image Credits: Chen, T., Itani, M., Eskimez, S.E. et al. Hearable devices with sound bubbles. Nat Electron(2024). https://doi.org/10.1038/s41928-024-01276-z
囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
実況者向け「ゲーミングマンション」内見してみた 防音・家賃はどんな感じ?【動画あり】
壁越しで“部屋の中の声”を盗聴する攻撃 屋内のモノから声の振動をミリ波で検知 米研究者らが開発
囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発Copyright © ITmedia, Inc. All Rights Reserved.