米OpenAIは4月21日(現地時間)、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて思考機能を搭載し、生成前に構図や正確性を検討してから出力する。日本語を含む非ラテン文字の描画精度も大きく向上したという。
同日からChatGPT、Codex、APIの全ユーザーに提供を開始。Enterprise向けも近日リリースする。
ChatGPTで「思考」(Thinking)またはProモデルを選ぶと、Webからリアルタイム情報を検索し、自身の出力を二重チェックした上で画像を生成できる。思考機能付きの高度な画像出力はChatGPT Plus、Pro、Businessの有料ユーザー向けだ。
日本語、韓国語、中国語、ヒンディー語、ベンガル語など、非ラテン文字も正しくレンダリングし、自然な流れで表示できるという。小さな文字、アイコン、密集した構図などを高解像度で描画できる。ポスターや図表、マンガなど言語を含む画像もイメージ通りに生成するという。
1つのプロンプトからキャラクターやオブジェクトの一貫性を保ちながら最大8枚の画像を同時に生成可能。マンガの連続ページや異なるアスペクト比・言語のSNS向け画像集など、従来は1枚ずつ生成して手作業でつなぎ合わせていたワークフローを一括で処理できる。
モデルの学習データを2025年12月時点に更新した。API向けには「gpt-image-2」として提供を開始した。Codexでは別途APIキー設定なしで画像生成を利用できる。ただし、APIでの2Kを超える出力は現在β版で、一貫性のない結果が生じる場合がある。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
OpenAIは、画像生成AIの新版「ChatGPT Images 1.5」を発表した。生成速度が最大4倍高速化し、指示追従性や写真編集能力、高密度なテキスト描画性能が大幅に向上。サイドバーには専用の「画像」メニューが追加され、直感的な操作が可能になった。無料版を含む全ユーザーに順次展開され、API利用料も従来より20%安価になる。
OpenAI、人気のジブリ風画像生成機能をAPIで提供開始
OpenAIは、ジブリ風画像生成で話題のAIモデル「gpt-image-1」の、APIを通じての提供を開始した。すでに、AdobeやFigma、Canva、Quora、Instacartなどが利用している。
ChatGPT最新モデル「o3」の画像生成機能を試す “ジブリ化”で物議の「4o」からどう変わった?
米OpenAIが新たに発表したハイエンドAIモデル「o3」。旧モデルに比べ推論性能が向上した他、新たにWeb検索と画像生成機能の併用にも対応したという。そのクオリティーや、画像をジブリ風の画像にする“ジブリ化”からよくも悪くも話題になったChatGPTの画像生成機能だが、o3ではどれだけ進化したのか。
ChatGPTに「ライブラリ」新設 過去に生成した画像を一覧
OpenAIは、「ChatGPT」に新タブ「ライブラリ」を追加した。過去に生成した画像を一覧するためのタブだ。
OpenAI、ChatGPTにGPT-4oベースの画像生成機能 セレブの画像も生成可能
OpenAIは、マルチモーダルモデル「GPT-4o」ベースの新たな画像生成機能をChatGPTに統合したと発表した。無料ユーザーも利用可能になる。リアルなセレブ画像も制限付で生成できる。






