検索
ニュース

「ChatGPT Images 2.0」発表、AIが"考えてから描く"画像生成モデル 日本語テキストもより正確に

Share
Tweet
LINE
Hatena

 米OpenAIは4月21日(現地時間)、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて思考機能を搭載し、生成前に構図や正確性を検討してから出力する。日本語を含む非ラテン文字の描画精度も大きく向上したという。

 同日からChatGPT、Codex、APIの全ユーザーに提供を開始。Enterprise向けも近日リリースする。

画像
編集部が作成した実際の使用例
画像
OpenAIの使用例より。日本語も自然に表示
画像
画像
写真の再現もリアルに
画像
ポスター風のデザインなども忠実に再現可能
画像
Macの画面でAAを表示、といった指示も再現する
画像
最新トレンドを反映したデザインも

 ChatGPTで「思考」(Thinking)またはProモデルを選ぶと、Webからリアルタイム情報を検索し、自身の出力を二重チェックした上で画像を生成できる。思考機能付きの高度な画像出力はChatGPT Plus、Pro、Businessの有料ユーザー向けだ。

 日本語、韓国語、中国語、ヒンディー語、ベンガル語など、非ラテン文字も正しくレンダリングし、自然な流れで表示できるという。小さな文字、アイコン、密集した構図などを高解像度で描画できる。ポスターや図表、マンガなど言語を含む画像もイメージ通りに生成するという。

 1つのプロンプトからキャラクターやオブジェクトの一貫性を保ちながら最大8枚の画像を同時に生成可能。マンガの連続ページや異なるアスペクト比・言語のSNS向け画像集など、従来は1枚ずつ生成して手作業でつなぎ合わせていたワークフローを一括で処理できる。

 モデルの学習データを2025年12月時点に更新した。API向けには「gpt-image-2」として提供を開始した。Codexでは別途APIキー設定なしで画像生成を利用できる。ただし、APIでの2Kを超える出力は現在β版で、一貫性のない結果が生じる場合がある。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る