メディア

カテゴリ：

速報

連載

コーナー：

ITmedia NEWS > AI+ >

口パクの顎の動きで音声認識　イヤフォンに後付け可能：Innovative Tech

» 2021年03月12日 06時27分公開

[山下裕毅，ITmedia]

Innovative Tech：

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

　米ニューヨーク州立大学ストーニーブルック校、インド工科大学ガンディーナガル校、米カリフォルニア・マーセッド大学、米テキサス大学アーリントン校による研究チームが開発した「JawSense」は、顎（あご）の動きで音声認識する音声コマンド・ウェアラブルデバイスだ。

　このデバイスは耳に装着し、音声認識をハンズフリーで行う。ヘッドフォンやイヤフォンへの後付けも可能だ。

JawSenseのイメージ図

JawSenseのプロトタイプ

　音声入力は、公共の場で使用する場合、機密情報漏えいやプライバシーの侵害の恐れがある。また、ノイズの多い環境では安定して使用できない。研究チームは、これら課題を解決するため、発話時に確実に動作する顎に着目した。

　今回の研究は、顎を動かすだけでコンピュータとの対話が行えるインタフェースを構築する。顎の動きと音素の関係をモデル化し、9つの音素を認識するための分類アルゴリズムを開発。発話時に発生する顎や頬の筋肉からの運動信号を利用し、音声なしの音素を認識する。

　プロトタイプは、顎関節付近に3軸加速度センサーを配置する耳かけ型ハードウェアで構成。顎の動きは、顎関節付近の皮膚表面に搭載した3軸加速度センサーで捉える。うなずき、頭の動き、あくびなど、人の動きに起因する非音声信号と外部からの可聴音によるノイズを抽出し除去する前処理を行う。

　声を出して話しているのか口パクなのかを区別するために、周波数スペクトルを解析して可聴音素を検出し、音声付き音素か音声なし音素かを区別する。

システムの概要図

　6人の被験者を対象に、9つの音素について実験したところ、騒がしい環境であるにもかかわらず、音声なし音素検出で92%の分類精度を達成したという。今後は、より小さなフォームファクターでの連続音声認識を目指す。

　動画はこちら。

スクリーンが動いても高速追従　液体レンズを使ったAFプロジェクションマッピング
動的なプロジェクトマッピングで課題となっていたフォーカス問題を解消する。
20機の小型ロボット群をハンドジェスチャーで直感操作　スタンフォード大など開発
群ロボットの操作を不慣れなユーザーがしやすいようにした。
一般人が撮影したネット上の写真から建物を高品質に3D化するGoogleの機械学習技術
観光客が撮影してネットで公開している写真を利用できる。

業務部門が抱える課題をITで解決（キーマンズネット）

アイティメディアからのお知らせ

キャリア採用の応募を受け付けています

SpecialPR

メールマガジンのお知らせ

ITmedia NEWSメールマガジン最新号テクノロジートレンドを週3配信

ご購読はこちら »

あなたにおすすめの記事PR

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

口パクの顎の動きで音声認識　イヤフォンに後付け可能：Innovative Tech

Innovative Tech：

関連記事

関連リンク

業務部門が抱える課題をITで解決（キーマンズネット）

RANKING

浅田真央さんの旧ドメイン、GMOが「アフィサイトに」と販売で批判殺到【訂正あり】

農水省の“クソダサ”ポスター話題　「AIよりよっぽど良い」の声も　担当者に狙いを聞いた

PayPay、他社クレカを使うなら「利用券」が必要に　8月末で従来方式は終了

数時間潜水できる"サイボーグゴキブリ"実現　人命救助で活躍期待　早大などが専用の潜水スーツ共同開発

AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか？　11のLLMで“ミルグラム実験”　抵抗できたのは……

アイティメディアからのお知らせ

口パクの顎の動きで音声認識 イヤフォンに後付け可能：Innovative Tech

Innovative Tech：

関連記事

関連リンク

業務部門が抱える課題をITで解決（キーマンズネット）

RANKING

浅田真央さんの旧ドメイン、GMOが「アフィサイトに」と販売で批判殺到【訂正あり】

農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた

PayPay、他社クレカを使うなら「利用券」が必要に 8月末で従来方式は終了

数時間潜水できる"サイボーグゴキブリ"実現 人命救助で活躍期待 早大などが専用の潜水スーツ共同開発

AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか？ 11のLLMで“ミルグラム実験” 抵抗できたのは……

アイティメディアからのお知らせ

口パクの顎の動きで音声認識　イヤフォンに後付け可能：Innovative Tech

農水省の“クソダサ”ポスター話題　「AIよりよっぽど良い」の声も　担当者に狙いを聞いた

PayPay、他社クレカを使うなら「利用券」が必要に　8月末で従来方式は終了

数時間潜水できる"サイボーグゴキブリ"実現　人命救助で活躍期待　早大などが専用の潜水スーツ共同開発

AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか？　11のLLMで“ミルグラム実験”　抵抗できたのは……