「ChatGPT Images 2.0」発表、AIが"考えてから描く"画像生成モデル　日本語テキストもより正確に

LINE

Hatena

　米OpenAIは4月21日（現地時間）、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて思考機能を搭載し、生成前に構図や正確性を検討してから出力する。日本語を含む非ラテン文字の描画精度も大きく向上したという。

　同日からChatGPT、Codex、APIの全ユーザーに提供を開始。Enterprise向けも近日リリースする。

編集部が作成した実際の使用例

OpenAIの使用例より。日本語も自然に表示

写真の再現もリアルに

ポスター風のデザインなども忠実に再現可能

Macの画面でAAを表示、といった指示も再現する

最新トレンドを反映したデザインも

　ChatGPTで「思考」（Thinking）またはProモデルを選ぶと、Webからリアルタイム情報を検索し、自身の出力を二重チェックした上で画像を生成できる。思考機能付きの高度な画像出力はChatGPT Plus、Pro、Businessの有料ユーザー向けだ。

　日本語、韓国語、中国語、ヒンディー語、ベンガル語など、非ラテン文字も正しくレンダリングし、自然な流れで表示できるという。小さな文字、アイコン、密集した構図などを高解像度で描画できる。ポスターや図表、マンガなど言語を含む画像もイメージ通りに生成するという。

　1つのプロンプトからキャラクターやオブジェクトの一貫性を保ちながら最大8枚の画像を同時に生成可能。マンガの連続ページや異なるアスペクト比・言語のSNS向け画像集など、従来は1枚ずつ生成して手作業でつなぎ合わせていたワークフローを一括で処理できる。

　モデルの学習データを2025年12月時点に更新した。API向けには「gpt-image-2」として提供を開始した。Codexでは別途APIキー設定なしで画像生成を利用できる。ただし、APIでの2Kを超える出力は現在β版で、一貫性のない結果が生じる場合がある。