ITmedia NEWS > 科学・テクノロジー >
セキュリティ・ホットトピックス

YouTubeで“聞こえない音”を流し、スマホを遠隔操作する攻撃 音声アシスタント機能を悪用Innovative Tech

» 2023年03月29日 08時00分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2

 米テキサス大学サンアントニオ校と米コロラド大学コロラドスプリングス校に所属する研究者らが発表した論文「Near-Ultrasound Inaudible Trojan(NUIT): Exploit Your Speaker to Attack Your Microphone」は、スマートフォンやスマートスピーカーの音声アシスタント(Siri、Google Assistant、Alexa、Cortana)に対する不可聴攻撃を提案した研究報告である。

 その手口は、インターネット(動画や音楽、Web会議など)を通じて、人間には聞こえない音を流し、リモートでスマートデバイスを操作するというもの。ユーザーは悪意ある聞こえない音が仕込まれたYouTubeを見てしまうと、知らない間に音声アシスタントへ音声コマンドを送られ入力されるわけだ。

スマートフォンの内蔵マイクから聞こえない音声コマンドを流し、スマートホームに「ドアを開け」と入力している

 「Near-Ultrasound Invisible Trojan」(NUIT)と呼ばれるこの手法は、スマートフォンやスマートスピーカーの音声アシスタントに、ユーザーの知らない間に悪意のある音声コマンドを送る攻撃だ。

 この攻撃は、ターゲットとなるデバイスの内蔵スピーカーを使って、超音波に近い周波数帯域(16kHz〜20kHz)の音声を再生することで行われる。スピーカーがあればそこから悪意あるコマンドを流し、それを同じデバイスのマイクもしくは近くのマイクに読み取らせることで悪意に操作する。

 この攻撃の特徴として、1台のデバイスを攻撃するだけでなく、そのデバイスから他のマイク内蔵デバイスへ被害を拡大できる点にある。例えば、PCで動画や音楽を視聴すると、動画コンテンツの音に隠れてスピーカーから聞こえない悪意ある音声コマンドが発信する。すると、そのPC周辺にあるスマートフォンやスマートホームがその悪意ある音声コマンドを読み取ってしまう。

PCのスピーカーから人には聞こえない音声コマンドでスマートホームに入力している様子

 このようにインターネットを介して不特定多数をターゲットに攻撃できるわけだが、ZoomなどのWeb会議を使えば特定のターゲットを攻撃することもできる。Web会議中はスピーカーをオンにしているケースが多いため、通話中に聞こえない音声コマンドを流して近くのスマートデバイスをリアルタイム攻撃する。

 攻撃者はデバイスに不正アクセスすると、まず始めに聞こえない音声コマンドでデバイスの音量を下げる。音声アシスタントの応答をユーザーに聞こえないようにするためだ。最初に音量を下げてから、より気が付かれない状態にしてさらに攻撃を進める。

 テストした17のスマートデバイスのうち、唯一Apple Siriデバイスはユーザーの声を盗む必要があるが、他の音声アシスタントデバイスはどんな声やロボット音声を使っても起動できた。

 この攻撃はソフトウェアの問題やマルウェアだけではなく、インターネットを利用したハードウェアの攻撃であり、脆弱性はマイクの設計の非線形性にある。そのため、マイクのメーカーなどが対処する必要があるという。

 防御策としては、マイクの許可を注意深く与えることや、それとスピーカーの代わりにイヤフォンやヘッドセットなどのマイクが付いているデバイスを使うことを推奨。イヤフォンやヘッドセットだと音量が小さく、被害デバイスのマイクに音が届かないため、有効であるという。

 実際に音声コマンドで攻撃している様子は、プロジェクトページ内の動画で確認できる。

Source and Image Credits: Qi Xia, Qian Chen, Shouhuai Xu. Near-Ultrasound Inaudible Trojan(NUIT): Exploit Your Speaker to Attack Your Microphone. USENIX Security 2023



Copyright © ITmedia, Inc. All Rights Reserved.