ITmedia NEWS >
STUDIO PRO

もう「テキストで動画編集」ができる時代に 試して分かったAIの進化っぷり小寺信良の「プロフェッショナル×DX」(1/3 ページ)

» 2023年05月16日 17時30分 公開
[小寺信良ITmedia]

 今ネット社会は、AIの進化に揺さぶられている。毎日画像生成AIで新しい画像が生み出され、次第に写真と見分けが付かなくなってきている。一方チャット系AIは検索補助ツールの領域を超えて、データ整形やアイデアツール、文書作成までこなせるようになった。

 いわゆる「文字起こし」も、ここにきて急速に誰でも利用できる機能になりつつある。すでにビジネスの現場でも、ミーティングのログやインタビューなどは、人が聞いて書き起こすものではなく、AIに音声や動画ファイルを放り込んで結果を待つものになっている。

 映像のプロ向けという点では、テレビ局向けにAIを使って音声をテキスト化し、自動字幕生成するシステムは、数年前から存在した。テレビ放送には聴覚障害者向けに字幕を提供する機能があるが、そうしたリアルタイム字幕への用途である。

 一方番組編集などリアルタイムではない現場では、基本的には人が聞いてテロッパーに入力するという作業が行なわれている。そんな状況に一石を投じたのが、Adobe Premiere ProのAI字幕作成機能であった。

2年ぶりに大進化したPremiere Pro

 2021年3月に登場した15.2のベータ版は、編集後のタイムラインに並んだ動画の音声をクラウド上のAIである「Adobe Sensei」へアップロードし、音声認識させて書き起こしデータを生成し、そこから字幕を作成するという機能であった。こうしてPremiere Proは、他社の追随を許さない最も先進的な編集ツールとなった。

 それが今年4月13日、さらに大幅なアップデートが発表された。今度は素材データすべてを書き起こし、そのテキストを編集すると動画の方も編集されるという、文字起こしベースの編集機能を実装した。現在はバージョン23.3のベータ版で実装されており、正式版の実装は5月ごろになる見込みだ。

 従来と違うのは、次バージョンからは動画素材を読み込んだ時点で、書き起こしツールが起動するところである。つまり字幕を付ける予定がなくても、編集のために書き起こしをするわけである。しゃべりのない動画の編集であれば、このプロセスをスキップすればいい。

読み込んだ素材全てに対して書き起こしを実行

 書き起こしは、以前はクラウド上のAIで行なっていたが、次バージョンではローカルで動作するようになっている。インターネットから隔離された環境でも利用できるだろう。

 長尺のインタビューなどは、話の内容を聞くだけでも実時間かかるわけだが、それを編集するとなれば、タイムコードと話の内容をメモしなければならない。だが書き起こされたテキストを読めば、話の内容はリアルタイムで動画を見るより早いし、どこが必要な部分なのかのあたりも付けやすい。

 さらにテキスト検索も使えるので、キーワードを検索することで、「あの話はどの辺だったか」をすぐに見つけることができる。今後、外国語翻訳といった機能が追加されてくるのであれば、さらに利便性が上がるだろう。

 書き起こされたテキストは、使用範囲を選択して「インサート」すると、タイムラインに配置される。テキストでカットをざっくり抜き出し、あとはタイムラインで細かく編集するという流れになる。またタイムラインに配置されたクリップを選択すると、テキスト欄もそれに連動する。この状態でも、テキスト側を編集すると、動画のほうも編集される。

使いたい部分をテキストで選択してタイムラインに配置

 つまりテキストエディタで文章の並び替えをする感覚で、動画の編集もできるというわけだ。このやり方、どこかで聞いたようなと思われた方は、結構色々試されている人だろう。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.