このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
OpenAIの研究チームが開発した「GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models」は、自然言語からフォトリアリスティックな画像を生成する機械学習モデルだ。
2021年1月に同団体が発表したGPT-3の画像版と呼ばれたテキスト→画像生成モデル「DALL・E」から約1年、忠実度が上がった進化モデルのGLIDEでは、以下のような画像を出力できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR