動画内の素早い動きから3D人体モデルを連続生成 深層学習を活用:Innovative Tech
ダンスのような激しい動きでも破綻なく3Dモデルを生成できる技術が生まれた。
Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
ドイツの研究機関Max Planck Institute for Intelligent SystemsとMax Planck ETH Center for Learning Systemsによる研究チームが開発した「VIBE」は、深層学習を用いることで、動画内で動く人の3次元姿勢と形状を連続的に推定する技術だ。
動画から人体の3次元モデルを連続的に推定する手法はこれまでにも研究されてきたが、複雑な動きの場合には正確性が失われ、細部でアーティファクト(ゆがみやズレ等)が起きていた。この課題に対して、これまでの研究成果を上回る高品質な3次元モデルを出力可能にしたのが今回の手法だ。
アーティファクトが少ない3次元モデルを生成するために、大規模な3次元モーションデータセット「AMASS」を採用。このデータセットを最大限活用するために、 GAN(Generative Adversarial Network)を用いて学習する。
具体的には、入力動画からCNN(Convolutional Neural Network)を用いて予測した各フレームごとの3次元モデル(SMPL=Skinned Multi-Person Linearモデルのパラメータ)と、AMASSデータセットからの3次元モデルを敵対させることで精度を高める手法を採用した。
学習したモデルは、人物の3次元姿勢と形状をより正確に反映し、ダンスのように素早い動きでも運動学的にもっともらしい動きの連続的なメッシュを生成する。
関連記事
- “実在しないリアルな顔”を自在に編集できる「StyleRig」 StyleGANで生成した顔の向き、表情、照明を制御
存在しない顔を自由に動かせるようになる。 - 他人の化粧を自分に転写できるバーチャルメイク技術「PSGAN」 動画にも対応
あの人のお化粧を自分にも、そして動きたい、というニーズに応えられる。 - AIで1枚の人物写真から高精細3Dモデル作成 Facebookなど開発
人物の正面からの写真があれば、背後も補完して3Dモデルを生成する夢の技術が開発された。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.