英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。
Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に描いている素晴らしい作品)というプロンプトで生成させた画像(画像:Stability AI)Stable Diffusion新版を提供する開発者プラットフォームは、米APIプラットフォーム企業Fireworks AIとの提携で提供する。将来的にはStability AIのメンバーシップを通じてモデルの重みを自社サーバでホストできるようにする計画という。
タイポグラフィ(文字デザイン)とプロンプトの忠実度で米OpenAIの「DALL・E 3」や米Midjourneyの「Midjourney v6」などの競合するテキストから画像への生成AIと同等かそれらを上回るとしている。
新版は新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャを採用し、画像と言語の表現に別々の重みセットを使うため、旧版と比較してテキストの理解とスペルの能力が向上したという。
APIでの提供と並行して、Stable Diffusion 3を搭載したStable Assistantのβ版の初期リリースに限られた数のユーザーを招待している。
新版を一般に公開しないのは、「悪意ある者による悪用を防ぐため」。研究者や専門家、コミュニティと継続的に協力することで、モデルの改善を続けるとしている。
Stability AI Developer Platform APIは専用サイトで確認できる。
有料版「ChatGPT」に「DALL・E 3」の画像編集ツール追加
Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に
話題の画像生成AI「Stable Diffusion」、ビジネスモデルは? 企業の利用状況は? 日本法人代表にいろいろ聞いてみた
「Stable Diffusion 2.0」リリース 高品質化、アダルト排除、解像度アップ、奥行推定など機能追加Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR