ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

天空の城を出現させる深層学習技術 動画内の空を入れ替える「Castle in the Sky」Innovative Tech

» 2020年12月22日 15時08分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 米ミシガン大学の研究員が開発した「Castle in the Sky」は、映像に記録した空を別のものに置き換える、深層学習を用いた合成法だ。従来の手法では動画撮影時にスマートフォン搭載のモーションセンサーが必要だったが、今回のアプローチでは画像情報のみ使う。

 撮影後の映像編集に使えるだけでなく、ARとしてリアルタイム表示できる。

photo 入力ビデオ(上)天空の城と空を合成した出力結果(下)
photo 入力ビデオ(上)宇宙船と空を合成した出力結果(下)

 合成プロセスは3ステップで行われる。

  1. 映像フレームを入力とし、深層学習ネットワークを使用し空の領域を検出する。セグメンテーションで空のマスク領域を推定する。
  2. 次に、検出した空の領域をテンプレートと入れ替えるため、連続するカメラの動きを推定する。フレーム間のカメラの動きを計算するために、空の領域とその中の物体(太陽や雲など)が無限遠に位置し、前景との相対的な動きがアフィン運動であると仮定している。推定したカメラの動きは仮想カメラに反映し、仮想カメラからのテンプレート画像をレンダリングし実画像と同期させている。
  3. カメラの動きに基づいてただ合成するだけでは、地面やその他の前景物体との不自然さ(色合いや光の加減など)が残る。この課題を解決するため、最後にライティングとカラーリングを調整して、合成結果を調和したものに仕上げる。
photo 本手法のパイプライン

 デモでは、晴れから雨などの天候の変換から、天空の城やスーパームーンの出現などを披露している。色合いやダイナミックレンジが調和しているだけでなく、雷の出現時はその時だけ全体が光るなど、動的な変化にも対応している。

photo 入力ビデオ(左)天気を変換した出力結果(右)
photo 入力ビデオの開始フレーム(左端)、異なる時間で処理された出力画像(右3枚)

Copyright © ITmedia, Inc. All Rights Reserved.