Google、文章から画像を生成するAI「Imagen」　「DALL-E 2より好まれる」

» 2022年05月25日 10時42分公開

[ITmedia]

　米Googleの研究部門Google Researchは5月24日（現地時間）、文章から画像を生成する拡散モデル「Imagen」を発表した。独自開発のベンチマーク「DrawBench」では、OpenAIの同様のAI「DALL-E 2」よりも人間に好まれる結果になったとしている。

「dog looking curiously in the mirror, seeing a cat.」というテキストで生成した画像

　拡散モデル（Diffusion Model）は、ランダムなドットのパターンから始まり、画像の特定の側面を認識すると、そのパターンを画像に向かって徐々に変更するモデルとGoogleは説明する。Imagenは、文章を理解するための大規模な変換言語モデルをベースに拡散モデルで画像を生成する。

Imagen生成画像の例（下のキャプションが与えた文章）

　Imagen開発の過程で、テキストデータのみでトレーニングした汎用の大規模言語モデルが画像合成のためのテキストエンコードに非常に効果的だということが分かったという。Imagenで言語モデルのサイズを大きくすると、画像拡散モデルのサイズを大きくするよりも結果がはるかに向上するとしている（詳細は論文）。

　GoogleはImagenを「現時点では公共の使用には適していない」と判断し、一般に公開はしないとしている。フェイクニュースやリベンジポルノに容易に悪用できそうなツールだからだ。また、変換モデルのデータはキュレーションしていないWeb上のデータセットに大きく依存しており、社会的なステレオタイプや人種差別的なコンテンツが含まれている可能性がある。「将来の作業での社会的および文化的バイアス」について調査し、こうした問題に取り組んでいくとしている。

AIに頼れば、絵心ゼロでもマンガのキャラクターを描けるのか？　Googleの「Giga Manga」を試してみる
AIの力を借りて誰でもマンガのキャラクターを描ける「Giga Manga」を試してみた。AIで線画を加筆し、着色もほぼ自動でできる。絵心ゼロの筆者でもうまく描けるだろうか。
最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題　文章から画像を生成する「DALL・E 2」、米OpenAIが発表
米AI研究企業OpenAIは、文章から画像を生成するAI「DALL・E 2」を発表した。生成した画像を掲載するデモサイトも公開しており、その絵のクオリティーの高さにTwitter上では「最新のAIやばすぎる」など、驚きの声が出ている。
OpenAI、自然な言葉の説明からイラストを描くAI「DALL・E」発表
AI研究企業のOpenAIが、人間の言葉による説明を入力するとそれを画像として生成するAI「DALL・E」を発表した。例えば「チュチュを着て犬を散歩させる大根の赤ちゃん」というシュールな設定でも絵にする。
OpenAI、文章から画像を生成する新モデル「GLIDE」　前モデルよりも高品質な画像を生成
OpenAIの研究チームは、自然言語からフォトリアリスティックな画像を生成する機械学習の新しいモデル「GLIDE」を開発した。