ITmedia NEWS > AI+ >
ニュース
» 2021年01月28日 09時01分 公開

赤ちゃんから老人の顔まで、1枚の顔写真で合成 深層学習で加齢変化を予測Innovative Tech

Adobeが協力しているので、将来のPhotoshopなどに入る可能性もあるか。

[山下裕毅,ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 米ワシントン大学、米スタンフォード大学、米Adobe Researchによる研究チームが開発した「Lifespan Age Transformation Synthesis」は、1枚の顔写真から過去と未来の経年変化を推定する深層学習フレームワークだ。0歳から70歳までの頭部全体を予測する。

photo 1枚の顔写真(左端)が与えられると、ネットワークは頭部全体の0〜70歳の経年変化を予測する

 加齢をシミュレーションする既存手法の多くは質感の変化に限定されており、人間の老化や成長過程で生じる頭部形状の変化を見落としている。そのため、質の高い結果は得られていない。

 この課題に挑戦するための理想的なモデルは、同一人物による1歳ごとのペア画像を用いて教師あり学習をすることだが、経年変化を捉えた大規模データセットは存在しないという。

 今回は、1歳ごとに再現するのではなく、6つの年齢クラス(0〜2、3〜6、7〜9、15〜19、30〜39、50〜69歳)を連続的に表現することで、全年齢の変換をカバーするアプローチを採用。人の外見は年齢とともに変化するが、アイデンティティーは固定されたままであると仮定し、年齢とアイデンティティーの特徴を別々に符号化している。

 Conditional GAN(敵対的生成ネットワーク) を使用し、1枚の写真から0〜70歳までの全頭部像を予測、成長過程の頭部の形状とテクスチャの両方を変化させることを学習する。

 訓練データには、GAN向けの人間の顔写真データセットであるFlickr-Faces-HQから年齢、性別、セマンティックセグメンテーションをラベル付けしたものを使用。 セマンティックセグメンテーションにより、画像から背景や衣服などのアイテムを除去する。

photo モデルの概要図

 この手法により人物のアイデンティティーと属性を維持したまま、広い範囲の年齢にわたる、現実に則した頭像を出力できるようになった。さまざまなデータセットを用いて出力を比較した結果、最新の類似技術よりも精度が高いことを示したという。

photo 異なる年齢の顔写真から0〜70歳までの合成顔を生成した出力結果

Copyright © ITmedia, Inc. All Rights Reserved.