画像生成AI「Stable Diffusion」に最新版「3.5」　全3モデル、商用利用も認める（1/2 ページ）

公開 2024年10月23日 14時14分

[ITmedia]

印刷する

　英Stability AIは10月22日（現地時間、以下同）、画像生成AI「Stable Diffusion 3.5」を公開した。同社の開発する「Stable Diffusion」シリーズの最新版で、全3種類のモデルを提供。いずれも無料で利用でき、商用利用も認めている。

画像生成AI「Stable Diffusion 3.5」リリース（画像は公式サイトより、以下同）

　Stability AIによれば「3.5」は旧モデルに比べてパフォーマンスを改善した他、多様な雰囲気の画像を出力できる点が特徴という。3D風、写真風、絵画風、線画風の出力に対応する他、例えば人の画像を生成する場合に「広範な指示をすることなく、さまざまな肌の色や特徴を有する人の画像を出力する」（Stability AI）としている。

Stable Diffusion 3.5の出力例（1/3）

Stable Diffusion 3.5の出力例（2/3）

　22日時点では、80億パラメータで最も性能の高い「Large」モデルの他、高速な蒸留版（学習した知識をより層の浅いニューラルネットワークに伝えたバージョン）「Large Turbo」をHugging Faceなどで提供。26億パラメータと小型化した「Medium」も29日にリリースする予定だ。このうちLarge TurboとMediumは「標準的な一般消費者向けのハードウェアでも高負荷をかけずに実行できるよう最適化した」（Stability AI）という。