ITmedia NEWS > 製品動向 >
STUDIO PRO

そう来たか! 想定外の進化を遂げたAI動画編集ツール「Vrew」のいま小寺信良のIT大作戦(1/2 ページ)

» 2025年06月26日 17時00分 公開
[小寺信良ITmedia]

 喋りの書き起こしがAIに任せられるようになってだいぶたつが、動画編集においても喋りを書き出してテキストベースで編集できるようになって約2年ぐらいたつ。その時の状況は以前まとめている。

 この時にご紹介した韓国Voyager Xの「Vrew」だが、順調にユーザー数を増やし、現在までの累計登録者数は150万人、月間アクティブユーザー数は15万人となっている。国別の内訳は、韓国6割、日本3割、その他となっており、日本にもおよそ5万人のアクティブユーザーがいるようだ。

 Vrewは動画の音声をAIで書き起こし、その書き起こしたテキストを編集することで動画も一緒に編集、字幕も自動で付けられるというツールだ。とはいえ、2年前の段階ではこれだけで完成というわけにもいかず、ラフに編集したものを他の編集ツールに持っていって仕上げる、あるいは字幕データをエクスポートして他の編集ツールに持っていくという使い方を想定していた。

 しかし2025年5月にメジャーアップデートとして3.0がリリースされ、大幅な機能追加が行われた。筆者も久しぶりに触ってみているところだが、その驚きの進化っぷりをご紹介したい。

生成AIで完パケまで行ける

 Vrewは日本語、英語、韓国語、スペイン語、中国語(繁体字)に対応している。現在英語分析については、より精度の高いElevenLabsのエンジンに変更しているという。多言語についても順次変更される予定だ。

 まずは従来の機能強化部分から触っていく。動画を読み込ませて編集と字幕情報がつくところまでは以前と同じだが、全体ビューとして「概要」モード(スクリプトビュー)が追加された。

これまでの編集モード
追加されたスクリプトビューモード

 これは長尺の動画を編集する場合、従来ビューでは言葉の区切りごとに1つのカットが構成されていくので、全体の話の流れがつかみにくいという問題があった。一方スクリプトビューではサムネイルがなくなり、書き起こし文章と同じ状態になるので、文章として喋りが把握しやすい。「改行モード」を使えばサムネイルなしの通常モードと同様になる。

 また話の区切りごとにブロック化する「シーン」機能を搭載した。動画読み込み時に「自動シーン分割」をONにしておくと、AIが話の内容を読み取り、自動的にシーン分けしてくれる。またシーンごとにタイトルを付けてくれる。もちろん編集時にも、任意のポイントでシーンを分けることができる。

 このシーンは、いわゆるアウトラインプロセッサのように、折りたたむことができる。編集箇所以外のシーンを折りたたんでおけば、全体の見通しが良くなるし、誤って全然違うところに手を付けてしまうこともない。

「シーン」の導入で全体像を把握しやすくなった

 また真ん中のサムネイル表示を使って、シーンの順番をドラッグ&ドロップで入れ替えることもできる。映像編集では収録した順番通りではなく、ブロックごとに入れ替えることも頻発するので、こうしたブロックごと移動できる機能は便利だ。

 素材ライブラリも充実させている。作品を完成させるには、インサート素材やBGM、効果音などが必要になるが、これらはVoyager Xが提供する汎用素材が利用できる。ビデオ素材はまだ少ないが、画像や矢印などの図形は充実している。BGMは現在274種類、効果音は984種類用意されており、キーワード検索で絞り込める。

自前のライブラリ機能を充実させた

 AI搭載編集ツールならではの機能としては、選択したクリップに対してAI画像を自動的に作り、インサートしてくれる機能がある。プロンプトに何も入力しなければ字幕情報から作成するし、プロンプトを使ってある程度の指示をすることもできる。

AIに画像生成させてインサートしてくれる

 これまで言葉で編集していくと、どうしてもジャンプカットが大量に発生する動画になりがちだった。だがAI画像生成である意味いくらでもインサートカットが使用できることにより、細かいジャンプカットをインサートで埋めていくという編集が、外部ツールに頼ることなくできるようになった。

 その他にも、AIキャラクター作成機能もある。プロンプトでキャラクターを作り、それにしゃべらせるというわけだ。ただ現時点では、言葉に合わせてしゃべるというよりは、単に口がパクパクするだけなので、キャラクターがしゃべるというにはまだ遠い。これはもう少し進化待ちである。

キャラクター生成機能も搭載

 また字幕データをベースに、AIで作られたキャラクターの声に差し替えてくれる機能もある。キャラクターは日本語対応しているものだけで118種類あり、フリープランで使用できるもの、有料プランで使用できるものに分かれている。

多数の音声AIモデルを実装

 いったん自分でしゃべったものから字幕を生成して喋らせることもできるし、テキスト入力して喋らせることもできる。若干イントネーションが怪しいところもあるが、取りあえずナレーションには困らなくなるのは強い。

 また自分でテキストを読み上げて、自分の声のモデルを生成することもできる。30ぐらいの文章を読み上げて、モデルが生成するまで30分ほどかかるが、それ以降はオリジナルAIモデルの一つとして使用できる。

オリジナルの音声モデルを作成できる
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

あなたにおすすめの記事PR