Innovative Tech(AI+)
米Netflixの動画生成AI「Go-with-the-Flow」 動画内のキャラをイメージ通りに動かせるアプローチ
Innovative Tech(AI+):
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
米Netflixなどに所属する研究者らが発表した論文「Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise」は、生成する動画内のオブジェクトの動きやカメラワークを、思い通りかつ直感的に制御できる手法を提案した研究報告である。
この技術により、例えば、犬の頭部だけを回転させたり、特定のオブジェクトを指定した経路で移動させたりなどの動画内の特定のオブジェクトの動きを自由に制御できる。またパンやチルト、ズームなどのカメラワークを自在に操ることが可能になる。さらに、既存の動画から動きのパターンを抽出し、別の動画に転写できる。
動画内のオブジェクトの動きを制御する場合、まず画面上で多角形を描いて特定の物体や領域を選択し、次にその部分に対して移動・回転・拡大縮小といった動きを指定する。さらに、視差効果を利用して異なる速度で動く複数の多角形を重ね合わせることで、3D的な動きの表現も可能である。
カメラの移動制御に関しては、既存の動画から抽出したオプティカルフローパターンを活用する手法を採用している。これにより、参照となる動画のカメラワークを、新しく生成する動画に適用できる。モーション転送の機能では、3Dレンダリングエンジンや深度情報など、多様な動きの情報源を活用可能だ。
従来の動画生成AIでは動きを制御するためにAIモデル自体を大幅に改変する必要があったが、この手法では生成過程で使用するノイズを加工するだけで実現できる。
具体的な仕組みは、動画のフレーム間の動きを検出し、その情報を使ってノイズを変形させる。研究チームはこの処理を高速に実行できる新しいアルゴリズムを開発。これにより画質を損なうことなく、自然な動きを表現することに成功した。
研究チームは、この技術を最新の動画生成モデルであるCogVideoXやAnimateDiffに実装し、その効果を検証した。評価実験では、生成された動画の画質、動きの制御精度、時間的な一貫性の全てにおいて、既存の手法を上回る結果を示している。局所的なオブジェクトの動き制御では82%、カメラワーク制御では90%のユーザーが、この手法を他の手法より優れていると評価している。
Source and Image Credits: Burgert, Ryan, et al. “Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise.” arXiv preprint arXiv:2501.08331(2025).
Copyright © ITmedia, Inc. All Rights Reserved.
Innovative Tech(AI+)
2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
2
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
3
GPT-5.5は最高性能ではないのに、なぜエンジニアが熱狂? カギは“最後まで自走する力”
-
4
「Gemini 3.5」登場 軽量モデルは一部3.1 Pro超え、高性能モデルは6月公開予定
-
5
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
6
【やさしいデータ分析】ベイズ統計入門 ~ 古典的な統計との違いと使い分け
-
7
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
8
GoogleのAIサブスク、最上位プランを値下げ 月額1万4500円の新プランも
-
9
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
10
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR