メディア
ITmedia AI+ >

君には見えるか? “錯視画像”を作り出す生成AI 「遠近で変わる絵」「白黒と色付きで変わる絵」などInnovative Tech(AI+)(1/3 ページ)

» 2024年05月15日 12時00分 公開
[山下裕毅ITmedia]

Innovative Tech(AI+):

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。

X: @shiropen2

 米ミシガン大学に所属する研究者らが発表した論文「Factorized Diffusion: Perceptual Illusions by Noise Decomposition」は、人間の知覚に錯覚を引き起こすような画像を生成する手法を提案した研究報告である。

 この手法の特徴は、画像を複数の成分に分解し、それぞれの成分を異なるテキストプロンプトで制御できる点にある。例えば、画像をガウシアンフィルター(画像のノイズを軽減するために使う画像処理フィルター)によって低周波成分と高周波成分に分解し、低周波成分には「人物の写真」、高周波成分には「動物の写真」といったプロンプトを与える。すると遠くから見ると人物に、近くで見ると動物に見えるような「ハイブリッド画像」を生成する。

 このように見る距離によって知覚が変化する現象は、人間の視覚処理が多重解像度で行われていることに起因する。

遠近で内容が変わって見える画像 小さい方の画像の内容が知覚できない場合は、もっと画像を小さくすると見える (左)山(右)熊
(左)山中の道、(右)シカ
(左)都会、(右)人の顔
(左)川、(右)牛
(左)花、(右)パンダ
(左)うさぎ、(右)人の顔
(左)花、(右)マリリン・モンロー
       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.