音声のAI処理も、バージョン20の1つの目玉となっている。
「AIオーディオアシスタント」は、カットページ、エディットページ、フェアライトページで使える機能だ。例えば喋り動画を整音する場合、これまではオーディオトラックを選んで「AI Voice Isolation」や「AI Dialogue Leveler」を設定する必要があった。また音楽をBGMとして加えた場合は、耳で聞いて音楽レベルを調整する必要があった。
一方「AIオーディオアシスタント」は、これらの処理を全部まとめて自動でやってくれる。音楽レベルのアップダウン(ダッキング)も、判断できる部分はやってくれるようだ。また公開先のレギュレーションに合わせたマスタリング機能もある。
タイムライン全体を処理させることになるので、まあまあ時間がかかるのだが、全域を自分で再生しながら調整していくより早い。また喋りのトラックには「Stereo Fixer」や「De-Esser」などのエフェクトも自動的に適用してくれる。いかんせん人間が手を出すところは何もないので、ある意味AIお任せになるのだが、気に入らなければ自分で後から調整すればいい。
今回フェアライトページにAI処理が多く追加されている。「AI会話マッチャー」は、条件が違う環境下で集音された音声の整合性を取ってくれる機能だ。カラーページにある、違うクリップのトーンに色味を合わせてくれる「ショットマッチ」の音声版といった感じである。「EQマッチャー」や「レベルマッチャー」も同様で、「AI会話マッチャー」の機能を個別に切り出したような機能である。
「AI IntelliCut」は、複数の機能の詰め合わせになっているようだ。「Remove Silence」は、音声の無音部分を自動的に削除してくれるツールだ。無音部分にノイズが目立つ場合などに有効だ。
この機能がフェアライトページに追加されたのは、別ソフトで編集したものが、MA処理のためにフェアライトに持ち込まれることが多いからだろう。編集時からDaVinci Resolveを使っていれば、その時点でAIによる整音ツールが使えるはずである。
「Checkboard to New Tracks」は、ミックス収録された複数人の音声データから、話者ごとに音声トラックを分けてくれる機能だ。特定の人だけレベルを上げたりEQをかけたい場合に使えるだろう。
「Create ADR Queue」は、オリジナルの音声から文字起こしを行い、アフレコ用のキューリストを作ってくれる機能である。映画などでは英語のせりふを日本語でアフレコする作業が発生するが、話者を聞き分けてキューリストを作ってくれるのは、現場ではありがたいはずである。
ただこれらの機能は、メニュー的にはバラバラの位置にあり、これらをひっくるめて「AI IntelliCut」というのである、という風にはまとめられていない。まあメニュー構造もβ版のうちはしょっちゅう変わるので、そのうち何らかの形で整理されるのかもしれない。
AIによる強力な機能として、「AIボイス変換」がある。これは、オリジナルの喋りの内容やイントネーションそのままに、別の人の声に差し替える機能だ。内蔵のプリセット音声は4つあり、それぞれピッチも変えられる。また特定の声を学習して、そのモデルを使用することもできる。
AIにしゃべらせるという機能は、これまでもいくつか登場している。以前ご紹介した「Captions」は、しゃべった音声を別の言語に変換し、話し手の声そのままでいわゆる「アフレコ」してくれる機能を持っている。
こうした機能は、比較的慎重に運用されてきた。なぜならば、こうした機能を利用すれば、悪意あるフェイク動画が簡単に作れてしまうからである。このためCaptionsでは、翻訳アフレコされた音声の編集や修正機能を搭載していない。
一方「AIボイス変換」では、こちらが勝手にしゃべった内容を、誰かの声で喋らせることができる。例えば首相がしゃべっている動画を入手し、ボイスモデルを作成し、本来言うはずのない話をしゃべらせることもできる。口パクは合わないだろうが、素人では気が付かないこともあるだろう。
こうした作業は、コマンド入力ベースのAIでは以前から可能だったが、難易度が高いのでそれほどやれる人もいなかった。しかしDaVinci Resolveのようなツールで作成できるというのは、難易度のレベルが違う。現在はまだ、ボイスモデルの作り方が公開されていないが、学習エンジンはすでにインストールできる状態にある。
今後この機能の使われ方は、注意してみておく必要があるだろう。
これまで編集ツールとAIという点では、Adobe Premiere Proの方が目立っていた。特に画像生成という分野では、Adobeなら学習ソースがきちんとライセンスされたものであるという保証ができるだけに、画像生成機能にも積極的に取り組んでいる。
一方DaVinci Resolveは、画像生成に関してはあまり関心がないようだ。現在多くのAIがしのぎを削っている状況なので、やりたい人はそっちでやってくださいということだろう。
それよりもコンテンツ制作の手順の多さを解消するという方向で、AI機能を設計しているように見える。今回特に音声に注力したのは、これまでどのソフトも手薄だったということもあるだろうし、音声処理はとにかく再生してリアルタイムで聞かなければならないので、時間がかかるという点が大きい。この点が効率化できるのは、音声処理が生業の人も助かるだろうし、映像は得意だが音声処理は苦手という人にも助かるはずだ。
案外これまで盲点だった部分を押さえにきた、というのが今回のバージョン20の方向性だろう。
どこまで使える? 動画の“続き”をAI生成できる「Premiere Pro」新機能 いろんなパターンで実験してみた
動画生成AI「Sora」爆速レビュー 50本生成して分かった、得意なこと・苦手なこと
「字幕大国ニッポン」でも役に立つ? DaVinci Resolve β版の文字起こし機能を試してみた
もう「テキストで動画編集」ができる時代に 試して分かったAIの進化っぷりCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR