英Stability AIは10月22日(現地時間、以下同)、画像生成AI「Stable Diffusion 3.5」を公開した。同社の開発する「Stable Diffusion」シリーズの最新版で、全3種類のモデルを提供。いずれも無料で利用でき、商用利用も認めている。
Stability AIによれば「3.5」は旧モデルに比べてパフォーマンスを改善した他、多様な雰囲気の画像を出力できる点が特徴という。3D風、写真風、絵画風、線画風の出力に対応する他、例えば人の画像を生成する場合に「広範な指示をすることなく、さまざまな肌の色や特徴を有する人の画像を出力する」(Stability AI)としている。
22日時点では、80億パラメータで最も性能の高い「Large」モデルの他、高速な蒸留版(学習した知識をより層の浅いニューラルネットワークに伝えたバージョン)「Large Turbo」をHugging Faceなどで提供。26億パラメータと小型化した「Medium」も29日にリリースする予定だ。このうちLarge TurboとMediumは「標準的な一般消費者向けのハードウェアでも高負荷をかけずに実行できるよう最適化した」(Stability AI)という。
いずれも非営利目的の場合は無料。商用の場合は年間収益100万ドル(23日時点で約1億5000万円)までは無料で、それを超える場合には個別の問い合わせが必要としている。
Copyright © ITmedia, Inc. All Rights Reserved.