ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

質感と形状を同時に転写する画像間スタイル変換技術 豊田工業大など開発Innovative Tech

» 2020年12月09日 07時00分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 豊田工業大学シカゴ校と米シカゴ大学の研究チームが開発した 「Deformable Style Transfer」(DST)は、画像から画像へのスタイル変換において、テクスチャ(表面の質感)とジオメトリ(形状)の両方を転写する深層学習ベースのフレームワークだ。

photo (左)元画像(中央左)スタイル画像(中央右)従来の方法で出力した結果(右)本手法で出力した結果

 顔の輪郭や髪形はそのままにアニメ風へ変換したり、建物の外観だけを変換したり、画像から画像へのスタイル変換については多くの手法が発表されてきた。しかし、そのどれもが色とテクスチャに重点を置き、ジオメトリを無視してきた。

 今回の手法では、テクスチャとジオメトリの両方を学習して、スタイル画像により一致させる最適化アプローチを提案する。従来の手法では元画像の輪郭や構造を完全に残すところを、本手法ではスタイルを転写する側の輪郭や構造も少し取り入れて変換する。これにより、間を取ったような形状の新しい画像が生成される。

photo (左)元画像(中央)スタイル画像(右)本手法を用いた出力結果

 このようなスタイル変換を行うには、元画像とスタイル画像間で空間的な関連付けを確立し、近似する変形を定義しなければならない。そのため、モデルでは画像間におけるキーポイントの特徴類似度が最大になるように学習され変形を決定する。この変形とテクスチャ変換を組み合わせることで、最終的な出力を行う。

 今回のモデルは分野、領域、種類などに制限されず、似たペア画像の訓練データセットも必要としていないため、コストを抑え、さまざまな画像の転写を実現するという。

 実験では、顔、動物、乗り物、風景などを用いたスタイル変換を行い評価した。ペア画像の形状が違いすぎるとうまくいかない場合があるものの、おおむねどれも高品質なスタイル化に成功したとしている。

photo 動物や物体と絵画のスタイル変換
photo 顔画像と似顔絵のスタイル変換
photo 1枚の元画像から複数のスタイルに変換
photo 複数の元画像を1種類のスタイルに変換

Copyright © ITmedia, Inc. All Rights Reserved.