OpenAIは、日本語を含む高度なテキスト描写能力を備えた次世代画像生成モデル「ChatGPT Images 2.0」を発表した。レイアウト再現や柔軟な編集機能を備え、実用性が向上した。
OpenAIは2026年4月21日(現地時間)、画像生成AIの次世代モデルとなる「ChatGPT Images 2.0」を発表した。複雑な視覚処理タスクに対応し、プロフェッショナルな業務環境における実用性が同社の従来モデルより大幅に高められているという。
ChatGPT Images 2.0は画質、指示への忠実度、そして複雑なレイアウトの再現において飛躍的な進化を遂げたという。同社は、写真のようなリアリズムから独創的なアート、さらには実用的なインフォグラフィックに至るまで、多種多様なビジュアルを生成できると強調している。これによって、企業におけるクリエイティブ制作プロセスの短縮と、質の高いビジュアルコンテンツの内製化が加速すると見込んでいる。
ChatGPT Images 2.0では、画像内におけるテキスト生成精度が向上した。従来のモデルでは困難とされていた「指定した文字の正確な描写」が可能となり、ポスター、書籍の装丁、製品ロゴなどのデザインにおいて実用性が格段に高まったとされる。
日本語を含む多言語への対応も強化された。同社は、日本語特有の複雑な字体も正確にレンダリングできると説明しており、漫画の台詞や看板の文字、企業のプレゼンテーション資料などで、言語の壁を感じさせないビジュアル表現が可能になったと述べている。
OpenAIは、本モデルを単なる生成ツールに留まらず、ユーザーのアイデアを即座に視覚化する「視覚的な思考パートナー」(Visual Thinking Partner)と位置付けている。ユーザーは、アスペクト比の自由な変更や、画像の一部を修正・追加するインペインティング機能を利用することで、生成結果に対して直接的に編集を加えられる。こうした操作性の向上によって、ブレインストーミングからプロトタイプ制作まで、クリエイティブな思考プロセス全体を支援する。
新たに提供されるAPI「gpt-image-2」を通じて、自社の製品やサービスに本モデルの機能を直接組み込むことが可能になる。同社はこのAPIの提供によって、カスタムデザインツールや自動バナー生成システムなど、画像生成機能を核とした独自の法人向けアプリケーションの構築が容易になると述べている。
一方で、OpenAIは幾つかの制限事項についても言及している。安全性の観点から、公共の利益に反するコンテンツや特定の個人を傷つけるような画像の生成には制限が設けられている。また、極めて複雑な空間配置や、物理法則を逸脱した抽象的な概念の描写においては、依然として意図しない出力が生じる可能性があることを認めている。
本モデルの提供形態について、OpenAIは「ChatGPT Plus」「Team」「Enterprise」利用者を対象に順次ロールアウトを開始すると説明している。また、API利用に関しては、使用量に応じたトークン課金制(ティア別価格設定)が適用される予定だ。詳細な価格体系については、同社の公式プラットフォームにて順次公開を予定してる。
自社のAIが攻撃者のアシスタントに? 「LLM Jacking」の深刻なリスク
AI規格「MCP」に構造的欠陥? セキュリティ企業が指摘するもAnthropicは修正否定
OpenAI、Codexに「自律型UI操作」機能など追加 PC画面の直接操作で定型業務と開発フローを高速化
Anthropicが警鐘を鳴らすAI時代のサイバー脅威 企業が採用すべき対策とはCopyright © ITmedia, Inc. All Rights Reserved.