ITmedia NEWS > AI+ >
ニュース
» 2021年10月08日 08時00分 公開

ペラペラ曲がる紙に合わせて映像合成 NVIDIAなどが技術開発Innovative Tech

動画内の画像を別の画像や映像に変換できるオプティカルフロー推定のための深層学習フレームワーク。

[山下裕毅,ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 香港中文大学、中国浙江大学、米NVIDIAによる研究チームが開発した「LIFE: Lighting Invariant Flow Estimation」は、動画内の画像を別の画像や映像に変換できるオプティカルフロー推定(動く対象物の各画素がどの位置に移動したかを数値で表す各画素の移動量のこと)のための深層学習フレームワークだ。

 カメラの視点や照明が大きく異なっても安定して画像を変換できる。また複雑に曲がる紙のような表面に対してもズレたり乱れたりせず、ぴったり貼り付いているかのような画像合成ができる。

photo
photo 紙の表面が複雑に変形しても映像がそれに応じて変形し続けている様子

 動画内の一部分の対象だけ別の画像に変更し、カメラ視点が移動してもそれに応じて常に貼り付いているかのように表示し続ける技術の中でも、動く対象を機械学習でオプティカルフロー推定し特徴量マッチングする手法は精度が高いことが知られている。

 しかしカメラ視点が大きく変わるシーンやモーションブラー、照明の変化が大きい場合は、その精度は著しく低下する。複雑な変形を伴う紙の場合も画像が乱れてしまう。

 これら課題に挑戦するため、研究チームはカメラ視点や照明変動が大きい場合でも安定して画像を変換できる、オプティカルフロー推定のための弱教師あり学習フレームワークを構築した。画像間の相対的なカメラポーズを推定し、画像間の特徴量マッチングを行う。

 有効性を評価するため、A4サイズの用紙に印刷した絵画に他の画像を変換する実験を行った。他の類似手法と比較した結果、どの手法よりも安定した変換を実現したという。プロジェクトページにて比較映像を確認できる。

 この手法は、相対的な姿勢、視覚的な位置の特定、ホモグラフィ変換、AR(拡張現実)など、画像間の対応関係の確立を必要とするさまざまなアプリケーションにも適応できるという。

 動画はこちら

Copyright © ITmedia, Inc. All Rights Reserved.