OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
OpenAIは、画像生成AIの新版「ChatGPT Images 1.5」を発表した。生成速度が最大4倍高速化し、指示追従性や写真編集能力、高密度なテキスト描画性能が大幅に向上。サイドバーには専用の「画像」メニューが追加され、直感的な操作が可能になった。無料版を含む全ユーザーに順次展開され、API利用料も従来より20%安価になる。
米OpenAIは12月16日(現地時間)、画像生成AIの新版「ChatGPT Images 1.5」をリリースしたと発表した。画像生成速度が最大4倍高速化するなどの改善が行われた。
ChatGPT Images 1.5は、OpenAIの新しい主力画像生成モデルによって提供されており、ゼロからの画像作成でも写真編集でも、思い描いた通りの出力を得られることを目指しているという。APIでも提供が開始されている。
強化・改善点は多岐にわたり、特にモデルの指示追従性と編集能力が大幅に向上した。アップロードされた画像に対して編集を依頼する際、ユーザーの意図にこれまで以上に忠実に従い、ライティング、構図、人物の見た目といった要素を一貫して維持しながら、要求された部分のみを正確に変更できるようになったとしている。これにより、より実用的な写真編集や、信憑性の高いバーチャル試着やヘアスタイルシミュレーション、元の画像の要素を保持した概念的な変換などが可能になるとして、ChatGPTは「ポケットの中のクリエイティブスタジオ」と評している。
また、より高密度で小さなテキストも処理できるようになり、テキストレンダリングにおいても進歩を見せている。例えば、新聞の記事や詳細な表、リストなど、テキストが密集しているコンテンツを正確に描画できるようになった。
操作性の面では、画像生成と探索をすぐに開始できるよう、ChatGPTのサイドバーに専用のメニュー項目「画像」を追加した。これを選択すると、メイン画面にプリセットフィルターやトレンドのプロンプトが表示され、プロンプトを記述しなくても画像生成を試せる。
画像生成速度は最大4倍高速化。また、他の画像を処理中でも新しい画像を生成できるようになった。
この新しいChatGPT Imagesモデルは、同日から無料ユーザーを含むすべてのChatGPTユーザーとAPIユーザーに対し、グローバルで展開が始まっている。ただし、BusinessおよびEnterpriseへのアクセスは後日となる。APIでは、GPT Image 1.5の画像入力および出力のコストがGPT Image 1と比較して20%安価になった。
アプリ担当CEOであるフィジー・シモ氏は、自身のブログで今回のリリースについて「テキストからより動的なAI体験への移行」の一環だと語った。画像作成と編集はチャット向きではなかったため、視覚に特化して構築されたクリエイティブスタジオのように機能する専用スペースの導入が重要であり、これにより「頭の中にあるもの」と「それを実現する能力」との間の距離を縮められるとしている。
サム・アルトマンCEOはXで、この機能で生成したマッチョな消防士姿の自身の画像を披露した。
OpenAIは3月末にChatGPTにGPT-4oベースの画像生成機能を統合し、リリース後約10日で7億枚以上の画像が生成されるという人気を博したが、米Googleが8月にリリースした「Nano Banana」によって、画像生成AIの勢力図は変化していた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「GPT-5.2」登場 「Gemini 3」の“コードレッド”後、性能を大幅強化
OpenAIは、Googleの「Gemini 3」に対抗し、最新フロンティアモデル「GPT-5.2」を発表した。知的労働タスクのベンチマークで人間を超える割合が70.9%に向上。ChatGPTの有料プランユーザー向けにロールアウトを開始し、Microsoft 365 CopilotやPerplexityにも導入された。
ディズニー、OpenAIに約1550億円出資 「Sora」でミッキーマウスなどの動画が生成可能に
The Walt Disney Companyと米OpenAIは12月11日(現地時間)、Disneyが動画生成AI「Sora」の初の大手コンテンツライセンスパートナーとなる契約を締結したと発表した。DisneyはOpenAIに10億ドル(約1550億円)の出資を行う他、26年からDisney、Marvel、Pixar、Star Warsの200以上のキャラクターを使って短編動画を生成できるようになる。
Google、画像生成AI「nano-banana」発表 画像内の人やモノの一貫性保つ性能強化 編集も自然言語で自在に
米Googleは、新たな画像生成AIモデル「Gemini 2.5 Flash Image」(通称:nano-banana)を発表した。前モデルに比べ、複数の画像を生成する際に画像内の人やモノの一貫性保持する機能や、自然言語の指示による画像編集の性能などを強化したという。
OpenAI、ChatGPTにGPT-4oベースの画像生成機能 セレブの画像も生成可能
OpenAIは、マルチモーダルモデル「GPT-4o」ベースの新たな画像生成機能をChatGPTに統合したと発表した。無料ユーザーも利用可能になる。リアルなセレブ画像も制限付で生成できる。


