このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
OpenAIの研究チームが開発した「GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models」は、自然言語からフォトリアリスティックな画像を生成する機械学習モデルだ。
2021年1月に同団体が発表したGPT-3の画像版と呼ばれたテキスト→画像生成モデル「DALL・E」から約1年、忠実度が上がった進化モデルのGLIDEでは、以下のような画像を出力できる。
左上:電卓を使うハリネズミ、右上:赤い蝶ネクタイと紫のパーティー帽をかぶったコーギー犬、左下:シュルレアリスムのサルバドール・ダリが描いたチェッカーをする猫、右下:グランドキャニオンの後ろで沈む夕日を撮影したプロフェッショナルな写真
左上:ヴィパッサナーで瞑想するロボットたち、右上:湖の隣の小さなコテージのある秋の風景、左下:サイケデリックなハムスター・ドラゴンを描いた高品質の油絵、右下:スーパーヒーローのコスチュームを着たアルバート・アインシュタインのイラスト(胸元のマークがアルバートのAにも見える)Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR