ITmedia NEWS > STUDIO >
ニュース
» 2021年11月24日 13時00分 公開

ベタ塗りすら不要、NVIDIAのお絵かきAIが進化 文字からリアルな画像生成

米NVIDIAが、風景画像を自動生成する同社AI技術の最新版「GauGAN 2」を発表。従来はベタ塗りからリアルな画像を生成できていたが、GauGAN 2では文字情報を与えるだけで画像を生成できるようになった。

[井上輝一,ITmedia]

 米NVIDIAは11月22日(米国時間)、風景画像を自動生成する同社のAI技術「GauGAN」(ゴーギャン)の新モデルである「GauGAN 2」を発表した。従来はベタ塗りからリアルな画像を生成できていたが、GauGAN 2では文字情報を与えるだけで画像を生成できるようになった。

岩場に向かって白波が立っている様子の画像が文字から生成されている

 同社が公開している動画では「ocean waves hitting rocks on the beach」(ビーチの岩に当たる波)と入力する過程が収められており、「ocean」の段階では湾を俯瞰した画像が作られ、「waves」まで入れると波が現れ、「hitting rocks」まで入れた段階では波打ち際の画像が生成されている。

「ocean」の段階では湾を俯瞰した画像が作られている
「waves」まで入れると波が現れる
「hitting rocks」まで入れた段階では波打ち際の画像が生成されている

 最後の「on the beach」の段階では、手前に岩場ができ、岩場に向かって白波が立っている様子の画像となっている。

できあがった画像

 同社のスーパーコンピュータ「NVIDIA Selene」を使い、1000万枚の風景画像を学習したという。その際、研究チームは「冬」や「霧」「虹」といった各画像の特徴を表す単語をひも付けていた。

 同技術を体験できるWebアプリのデモ版を公開している。文字から画像を生成した後に、ベタ塗り機能を使って調整し、再度画像を生成することも可能だ。

Webアプリのデモ版の使い方

Copyright © ITmedia, Inc. All Rights Reserved.