OpenAI、人気のジブリ風画像生成機能をAPIで提供開始

» 2025年04月24日 10時33分公開

[ITmedia]

　米OpenAIは4月23日（現地時間）、ChatGPTで人気の画像生成機能をAPIを通じて開発者や企業が利用できるようにしたと発表した。

　ジブリ風画像が作れると話題のこの機能は3月25日にChatGPTの有料プランで利用可能になり、最初の1週間で世界中の1億3000万人以上のユーザーが7億枚以上の画像を生成するほどの人気ぶりとなった。

　今回APIで提供されるのは、ChatGPTの画像生成を支えるネイティブなマルチモーダルモデル「gpt-image-1」だ。これにより、開発者や企業は、高画質な画像生成を自身のツールやプラットフォームに容易に統合できるようになるとしている。すでに、AdobeやFigma、Canva、Quora、Instacartなどが利用しているという。

利用例（画像：OpenAI）

　gpt-image-1の利用料金はトークン単位で課金され、テキストトークンと画像トークンで料金が異なる。

　実際の料金としては、低品質の正方形画像でおよそ2セント、中品質でおよそ7セント、高品質でおよそ19セントになる。また、生成に必要なトークン数は、画像の寸法と品質によって異なる。

　APIで提供するgpt-image-1モデルは、ChatGPTの画像生成と同様の安全ガードレールを採用しており、有害な画像の生成を制限する仕組みや、生成された画像へのC2PAメタデータの埋め込みが含まれている。開発者は、moderationパラメータを使用してモデレーションの感度を調整することも可能だ。

　顧客のAPIデータはデフォルトでは学習に使用されず、すべての画像入力と出力にはAPI利用ポリシーが適用される。

　なお、以下のような制限事項がある。

複雑なプロンプトの場合、処理に最大2分かかることがある
DALL・Eシリーズと比較して大幅に改善されたものの、テキストの配置や明瞭さにはまだ課題が残る場合がある
一貫した画像を生成できるが、複数の生成にわたって繰り返されるキャラクターやブランド要素の視覚的な一貫性を維持することが難しい場合がある
指示に従う能力は向上したが、構造化されたレイアウトに要素を正確に配置することが難しい場合がある

　また、利用開始前にAPI Organization Verification（API組織認証）が必要となる場合がある。必要な場合は、開発者コンソールから組織設定を確認する必要がある。

ChatGPT最新モデル「o3」の画像生成機能を試す　“ジブリ化”で物議の「4o」からどう変わった？
米OpenAIが新たに発表したハイエンドAIモデル「o3」。旧モデルに比べ推論性能が向上した他、新たにWeb検索と画像生成機能の併用にも対応したという。そのクオリティーや、画像をジブリ風の画像にする“ジブリ化”からよくも悪くも話題になったChatGPTの画像生成機能だが、o3ではどれだけ進化したのか。
ネットにあふれたAI製「ジブリ風画像」――最近の事例から考える「AIに学習されない自由」
3月26日に行われたOpenAIのGPT-4oのアップデートでは、画像生成機能が大幅に改善され、多くのユーザーがこの機能のために殺到した。3月31日には、無料ユーザーにもこの機能が開放され、SNSでは多くのスタジオジブリ風自画像があふれた。AIと著作権の関係は今どうなっているのか、最新の事情を組み入れながら、整理しておこう。
ChatGPTの新画像生成、利用急増で無料ユーザー向け延期　「GPUが溶けてる」とCEO
OpenAIは、「ChatGPT」の新たな画像生成機能の無料ユーザーへの提供を延期すると発表した。予想をはるかに上回る人気で、一時的にレート制限を導入するとしている。X上には「ジブリ風」と指定したアニメ画像が多数投稿されている。
OpenAI、ChatGPTにGPT-4oベースの画像生成機能　セレブの画像も生成可能
OpenAIは、マルチモーダルモデル「GPT-4o」ベースの新たな画像生成機能をChatGPTに統合したと発表した。無料ユーザーも利用可能になる。リアルなセレブ画像も制限付で生成できる。