Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
Stability AIは、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。タイポグラフィとプロンプトの忠実度は「DALL・E 3」と同等もしくは上回るとしている。
英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。
Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に描いている素晴らしい作品)というプロンプトで生成させた画像(画像:Stability AI)
Stable Diffusion新版を提供する開発者プラットフォームは、米APIプラットフォーム企業Fireworks AIとの提携で提供する。将来的にはStability AIのメンバーシップを通じてモデルの重みを自社サーバでホストできるようにする計画という。
タイポグラフィ(文字デザイン)とプロンプトの忠実度で米OpenAIの「DALL・E 3」や米Midjourneyの「Midjourney v6」などの競合するテキストから画像への生成AIと同等かそれらを上回るとしている。
新版は新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャを採用し、画像と言語の表現に別々の重みセットを使うため、旧版と比較してテキストの理解とスペルの能力が向上したという。
APIでの提供と並行して、Stable Diffusion 3を搭載したStable Assistantのβ版の初期リリースに限られた数のユーザーを招待している。
新版を一般に公開しないのは、「悪意ある者による悪用を防ぐため」。研究者や専門家、コミュニティと継続的に協力することで、モデルの改善を続けるとしている。
Stability AI Developer Platform APIは専用サイトで確認できる。
関連記事
- 有料版「ChatGPT」に「DALL・E 3」の画像編集ツール追加
OpenAIは有料版ChatGPT内で画像生成AI「DALL・E」の画像を編集できるようにした。編集ツールで変更したい部分を選択して編集できる。全体のスタイルの変更なども可能だ。 - Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に
画像生成AI「Stable Diffusion」で知られるStability AIはテキストで作曲できる生成AI「Stable Audio 2.0」を発表した。旧版では45秒までだった曲の長さが最長3分までに伸びた。16曲までは無料で作曲できる。 - 話題の画像生成AI「Stable Diffusion」、ビジネスモデルは? 企業の利用状況は? 日本法人代表にいろいろ聞いてみた
画像生成AI「Stable Diffusion」開発元の日本法人代表ジェリー・チーさんに、企業での利用状況やビジネスモデル、クリエイターからの反応などについて、いろいろと聞いてみた。 - 「Stable Diffusion 2.0」リリース 高品質化、アダルト排除、解像度アップ、奥行推定など機能追加
英Stability AIが画像生成AI「Stable Diffusion」のバージョン2.0をリリースした。生成画像の高品質化に加え、アダルトコンテンツの排除、画像内容の奥行きを保持しながらの画像変換などの新機能を追加した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.