ITmedia NEWS > STUDIO >
ニュース
» 2020年09月04日 08時24分 公開

ビデオ会議からキータイプ音をなくせ! 「タイプ音除去アプリ」を試す (1/2)

[西田宗千佳,ITmedia]

 ビデオ会議に新しいマナーはいらないと思っているが、それでも生まれるものはある。その典型は、「相手が話している時で、自分が話す必要がない時は小まめにミュートする」ということだろうか。

 特にメモにPCを使っている場合には、このことが重要になる。筆者の場合だと、インタビューや記者会見のQ&A中、質問しつつメモを取る場合、どうしてもタイプ音が出る。それをマイクで拾われると、聞いている全員に聞こえるので耳障りなのだ。

 というわけで、いまは自分で小まめにミュートする場合が多いし、主催者が回答者以外を強制的にミュートするようになっている場合もある。

 確かに必要な配慮だが、これはけっこう煩わしいものだ。こちらでミュートするのを忘れていたりするとちょっと恥ずかしい。また、質問には「相づち」などがあった方が反応しやすいのも事実だ。

 そういう課題の解決方法は2つある。指向性の高いマイクを使って声以外を拾わなくする方法、そして「タイプ音ノイズの除去ソフト」を使うことだ。今回は特に、後者のアプローチを試してみよう。意外なほど効果的で、この先の未来が予想できる面白い技術だ。

 なお、今回の記事では動画を多数紹介しているが、「音」が重要なので、ぜひ音声をオンにして(もしくはヘッドフォンを使って)再生しながら読んでいただきたい。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2020年8月31日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みはこちらから

ノイズキャンセルヘッドフォンとは原理が異なる「AI」でのアプローチ

 ノイズキャンセルというと、多くの人はいわゆる「ノイズキャンセルヘッドフォン」を思い浮かべるだろう。だが、今回紹介するノイズ除去ソフトは、それらとは仕組みが大きく異なる。

 ノイズキャンセルヘッドフォンは、簡単に言えば外部の音を取り込み、その逆位相の音を重ねることで音を消す。仕組み上、(理想的には)外部の音が全て消える。複雑な処理ではないので遅延もほとんど発生しない。

 一方この場合には、「特徴的な耳障りな音」だけを消すのが難しい。例えば「声だけ」とか「キーボードのタイプ音だけ」とかだ。ジェット機のエンジン音や電車の走行音、声などに多く含まれる「特徴的な周波数帯」をまとめて対処することはできるが、別に音そのものを認識しているわけではないから、ピンポイントに消せるわけではないのだ。

 だが、今回テストした「タイプ音ノイズの除去ソフト」はちょっと違う。機械学習によって「必要な音」、すなわち音声を学習し、その成分以外を消すことで対処している。いわゆる「エッジAI」の活用例なのだが、その性質上、相応の処理能力が必要になるし、原理的に遅延が避けられない。

 同じノイズキャンセルであっても、「全体アプローチ」と「個別の要素へのアプローチ」であり、まったく違う存在なのだ。

エッジAI技術を使って「音声だけ」をエンハンス

 「タイプ音ノイズの除去ソフト」に代表されるアプローチは、比較的最近生まれたものだ。

 この種のソフトで最も有名なのは、米NVIDIAが4月に公開した「RTX Voice」ではないだろうか。NVIDIAが自社GPUを活用するソフトとして発表したことで話題となった。

 ではその実力を……といいたいところだが、このツールはNVIDIAの「RTX」シリーズのGPUを使っていないと利用できない。筆者は1世代前の「GTX」シリーズを搭載したPCを使っているので公式にはインストールできない。非公式な方法でインストールできるのは知っているが、利用許諾などに抵触する可能性が否定できないので、ここで紹介するのはやめておく。

 というわけで、別の選択肢を用意した。

 今回テストに使ったのは、米Krisp Technologiesの「Krisp」と、米BabbleLabsの「Clear Edge」。どちらも試すだけなら無料だ。KrispはWindowsとMacの両方で、Clear EdgeはWindowsで利用できる。

 今回は同じ条件で比べるため、どちらも動作するWindowsを使っている。

 ソフトとしてはどちらも似たような作りだ。簡単に言えば、各アプリが「仮想的なマイクデバイス」「仮想的なスピーカーデバイス」として動作する。

 もう少し平易に動作だけを説明すれば、マイクデバイスや音声出力デバイスからの音をソフトが受け取り、ノイズを消して声を明瞭にする処理をした上で次に受け渡す。すなわち、「マイクデバイスの入力音からノイズが消える」「再生している音からノイズが消える」ということになるわけだ。

photo KrispのUI。マイク・スピーカーそれぞれでノイズを消すかどうかと、どのデバイスを対象にするかを選ぶ
photo Clear EdgeのUI。考え方はKrispと同じ

 Zoomなどのアプリから利用する場合には、「仮想的なマイクデバイス」になっている各アプリを、各アプリの設定から「マイク」「スピーカー」などとして選べばいい。

photo Zoomでの設定例。例えば赤枠内で「Krisp」を選べば、マイクを通した音からノイズが消える

 注意点としては、「自分が発するタイプ音」などのノイズを消すには「マイク」の設定を変え、「相手が発するタイプ音」などを消すには「スピーカー」の設定を変える、ということくらいだろうか。言われてみれば当たり前だが、逆にすると、自分にはノイズが消えて聞こえても、相手からは消えているように聞こえない。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.