ペラペラ曲がる紙に合わせて映像合成 NVIDIAなどが技術開発:Innovative Tech
動画内の画像を別の画像や映像に変換できるオプティカルフロー推定のための深層学習フレームワーク。
Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
香港中文大学、中国浙江大学、米NVIDIAによる研究チームが開発した「LIFE: Lighting Invariant Flow Estimation」は、動画内の画像を別の画像や映像に変換できるオプティカルフロー推定(動く対象物の各画素がどの位置に移動したかを数値で表す各画素の移動量のこと)のための深層学習フレームワークだ。
カメラの視点や照明が大きく異なっても安定して画像を変換できる。また複雑に曲がる紙のような表面に対してもズレたり乱れたりせず、ぴったり貼り付いているかのような画像合成ができる。
動画内の一部分の対象だけ別の画像に変更し、カメラ視点が移動してもそれに応じて常に貼り付いているかのように表示し続ける技術の中でも、動く対象を機械学習でオプティカルフロー推定し特徴量マッチングする手法は精度が高いことが知られている。
しかしカメラ視点が大きく変わるシーンやモーションブラー、照明の変化が大きい場合は、その精度は著しく低下する。複雑な変形を伴う紙の場合も画像が乱れてしまう。
これら課題に挑戦するため、研究チームはカメラ視点や照明変動が大きい場合でも安定して画像を変換できる、オプティカルフロー推定のための弱教師あり学習フレームワークを構築した。画像間の相対的なカメラポーズを推定し、画像間の特徴量マッチングを行う。
有効性を評価するため、A4サイズの用紙に印刷した絵画に他の画像を変換する実験を行った。他の類似手法と比較した結果、どの手法よりも安定した変換を実現したという。プロジェクトページにて比較映像を確認できる。
この手法は、相対的な姿勢、視覚的な位置の特定、ホモグラフィ変換、AR(拡張現実)など、画像間の対応関係の確立を必要とするさまざまなアプリケーションにも適応できるという。
関連記事
- リードで巧みに人間を誘導する盲導ロボット犬 米カリフォルニア大が開発
盲導犬の代替を目指す4足歩行ロボット。 - 飛行中にプロペラを変形できるドローン 狭い場所の通過や運搬作業など自由自在
狭い空間を通過する時などは機体を小さくできる、ホバーパイルダーがマジンガーZにドッキングする時を思わせるシーンも。 - ビデオ会議中のよそ見が可能に? 顔が常に前を向いているように見せる技術、NVIDIAが開発
相手と常にアイコンタクトを取っているように見せかける技術。 - 外部プロジェクターの映像をAR表示する眼鏡型デバイス 東工大などが開発
ARグラスは重くなりがち。その問題を解決する方法の1つが、外部から投影すること。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.