OpenAI、文章から画像を生成する新モデル「GLIDE」　前モデルよりも高品質な画像を生成：Innovative Tech（1/2 ページ）

OpenAIの研究チームは、自然言語からフォトリアリスティックな画像を生成する機械学習の新しいモデル「GLIDE」を開発した。

[山下裕毅，ITmedia] PC用表示関連情報

LINE

Hatena

Innovative Tech：

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

　OpenAIの研究チームが開発した「GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models」は、自然言語からフォトリアリスティックな画像を生成する機械学習モデルだ。

　2021年1月に同団体が発表したGPT-3の画像版と呼ばれたテキスト→画像生成モデル「DALL・E」から約1年、忠実度が上がった進化モデルのGLIDEでは、以下のような画像を出力できる。

左上：電卓を使うハリネズミ、右上：赤い蝶ネクタイと紫のパーティー帽をかぶったコーギー犬、左下：シュルレアリスムのサルバドール・ダリが描いたチェッカーをする猫、右下：グランドキャニオンの後ろで沈む夕日を撮影したプロフェッショナルな写真

左上：ヴィパッサナーで瞑想するロボットたち、右上：湖の隣の小さなコテージのある秋の風景、左下：サイケデリックなハムスター・ドラゴンを描いた高品質の油絵、右下：スーパーヒーローのコスチュームを着たアルバート・アインシュタインのイラスト（胸元のマークがアルバートのAにも見える）

左上：ベニスの運河に浮かぶボート、右上：星空の中の狐の絵、左下：クレヨンで描いた宇宙エレベーター、右下：シンセウェーブ風の近未来都市

左上：青い立方体の上に赤い立方体（影も自然）、右上：パンダが竹を食べているステンドグラスの窓、左下：コーギーピザのピクセルアート、右下：ニューヨークに立ち込める霧

　　　　　　 | 次のページへ