メディア
ITmedia AI+ >

OpenAI、人気のジブリ風画像生成機能をAPIで提供開始

» 2025年04月24日 10時33分 公開
[ITmedia]

 米OpenAIは4月23日(現地時間)、ChatGPTで人気の画像生成機能をAPIを通じて開発者や企業が利用できるようにしたと発表した。

 ジブリ風画像が作れると話題のこの機能は3月25日にChatGPTの有料プランで利用可能になり、最初の1週間で世界中の1億3000万人以上のユーザーが7億枚以上の画像を生成するほどの人気ぶりとなった。

 今回APIで提供されるのは、ChatGPTの画像生成を支えるネイティブなマルチモーダルモデル「gpt-image-1」だ。これにより、開発者や企業は、高画質な画像生成を自身のツールやプラットフォームに容易に統合できるようになるとしている。すでに、AdobeやFigma、Canva、Quora、Instacartなどが利用しているという。

 gpt 利用例(画像:OpenAI)

 gpt-image-1の利用料金はトークン単位で課金され、テキストトークンと画像トークンで料金が異なる。

 price 1

 実際の料金としては、低品質の正方形画像でおよそ2セント、中品質でおよそ7セント、高品質でおよそ19セントになる。また、生成に必要なトークン数は、画像の寸法と品質によって異なる。

 price 2

 APIで提供するgpt-image-1モデルは、ChatGPTの画像生成と同様の安全ガードレールを採用しており、有害な画像の生成を制限する仕組みや、生成された画像へのC2PAメタデータの埋め込みが含まれている。開発者は、moderationパラメータを使用してモデレーションの感度を調整することも可能だ。

 顧客のAPIデータはデフォルトでは学習に使用されず、すべての画像入力と出力にはAPI利用ポリシーが適用される。

 なお、以下のような制限事項がある。

  • 複雑なプロンプトの場合、処理に最大2分かかることがある
  • DALL・Eシリーズと比較して大幅に改善されたものの、テキストの配置や明瞭さにはまだ課題が残る場合がある
  • 一貫した画像を生成できるが、複数の生成にわたって繰り返されるキャラクターやブランド要素の視覚的な一貫性を維持することが難しい場合がある
  • 指示に従う能力は向上したが、構造化されたレイアウトに要素を正確に配置することが難しい場合がある

 また、利用開始前にAPI Organization Verification(API組織認証)が必要となる場合がある。必要な場合は、開発者コンソールから組織設定を確認する必要がある。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ