米OpenAIは4月21日(現地時間)、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて思考機能を搭載し、生成前に構図や正確性を検討してから出力する。日本語を含む非ラテン文字の描画精度も大きく向上したという。
同日からChatGPT、Codex、APIの全ユーザーに提供を開始。Enterprise向けも近日リリースする。
ChatGPTで「思考」(Thinking)またはProモデルを選ぶと、Webからリアルタイム情報を検索し、自身の出力を二重チェックした上で画像を生成できる。思考機能付きの高度な画像出力はChatGPT Plus、Pro、Businessの有料ユーザー向けだ。
日本語、韓国語、中国語、ヒンディー語、ベンガル語など、非ラテン文字も正しくレンダリングし、自然な流れで表示できるという。小さな文字、アイコン、密集した構図などを高解像度で描画できる。ポスターや図表、マンガなど言語を含む画像もイメージ通りに生成するという。
1つのプロンプトからキャラクターやオブジェクトの一貫性を保ちながら最大8枚の画像を同時に生成可能。マンガの連続ページや異なるアスペクト比・言語のSNS向け画像集など、従来は1枚ずつ生成して手作業でつなぎ合わせていたワークフローを一括で処理できる。
モデルの学習データを2025年12月時点に更新した。API向けには「gpt-image-2」として提供を開始した。Codexでは別途APIキー設定なしで画像生成を利用できる。ただし、APIでの2Kを超える出力は現在β版で、一貫性のない結果が生じる場合がある。
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
OpenAI、人気のジブリ風画像生成機能をAPIで提供開始
ChatGPT最新モデル「o3」の画像生成機能を試す “ジブリ化”で物議の「4o」からどう変わった?
ChatGPTに「ライブラリ」新設 過去に生成した画像を一覧
OpenAI、ChatGPTにGPT-4oベースの画像生成機能 セレブの画像も生成可能Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR