ITmedia NEWS > STUDIO >
ニュース
» 2020年11月27日 16時32分 公開

Innovative Tech:ディズニー、高解像度で顔を入れ替える深層学習技術を開発

顔をすげ替えて、光やコントラストも反映し、100万画素の解像度で出力できる。

[山下裕毅,ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 米Disney Researchとスイス連邦工科大学チューリッヒ校による研究チームが開発した「High-Resolution Neural Face Swapping for Visual Effects」は、動画内の顔を別の顔に置き換える深層学習ベースのアルゴリズムだ。光やコントラストも反映し、100万画素の解像度で出力する。

photo 本手法の出力結果。左端がターゲット画像、下列はソース画像

 動画内の人物の特徴を保持しながら、顔だけを転移させる手法は、深層学習を用いた手法で大きな成果を出しているが、メモリの制限、学習手順の不安定性、データサンプルの選択などで、高解像度画像の生成が困難な場合が多い。

 今回の手法は、顔の入れ替えを高解像度で写実的に行う教師なし学習アーキテクチャだ。コントラストと光(低周波照明)を維持する合成ステップと、時間的に安定したビデオシーケンスを生成するためのランドマーク安定化アルゴリズムを含む。

photo 本手法のパイプライン

 まず、ターゲット画像から検出した顔のランドマークを特定し、1024×1024の解像度に正規化する。次に正規化された顔をネットワークに投入し、ソース画像を基にしたマスクを出力し保存。最後にソース画像の顔をターゲット画像の顔領域に合成。画像間の照明条件が大きく異なっている場合は、継ぎ目を自然にするため、さらにコントラスト量を調整して統合する。

 このようにして学習したモデルは、高解像度での操作時に発生するゆがみや時間的不安定性、データ中の照明条件が異なる場合で起こる多くの問題を克服し、高解像度で写実的な合成画像が生成できたとしている。

photo 本手法の出力結果を類似研究と比較した表

Copyright © ITmedia, Inc. All Rights Reserved.