Stability AI、音楽生成AI「Stable Audio」を2.0に更新　最長3分の作曲が可能に

画像生成AI「Stable Diffusion」で知られるStability AIはテキストで作曲できる生成AI「Stable Audio 2.0」を発表した。旧版では45秒までだった曲の長さが最長3分までに伸びた。16曲までは無料で作曲できる。

[ITmedia] PC用表示関連情報

LINE

Hatena

AI活用のいまが分かる

　画像生成AI「Stable Diffusion」で知られる英Stability AIは4月3日（現地時間）、テキストで作曲できる生成AI「Stable Audio 2.0」を発表した。Stable AudioのWebサイトにログインすることで無料で利用できる他、間もなくStable Audio APIでも利用できるようになる見込みだ。

Stable Audio 2.0のWebアプリ版

　Stable Audioは、同社が昨年9月に発表した音楽生成AI。リリース当初の無料版では44.1kHzで最長45秒のトラックしか生成できなかったが、バージョンアップで最長3分のフルトラックの音楽を生成できるようになった。

　テキストからだけでなく、音声からも作曲できる。オーディオサンプルをアップロードし、自然言語のプロンプトでサンプルをアレンジできる。

　無料では、3分の音楽を20曲まで作れる。作った音楽を入力オーディオとして利用することもできる。

作曲例

　旧版同様に、モデルのトレーニングにはストック音楽サービスAudioSparxのデータを使った。AudioSparxに楽曲を登録しているアーティストは、Stable Audioのトレーニングをオプトアウトするオプションが提供されるようになった。

　また、クリエイターの著作権保護のために、生成した音楽のアップロードについてはAudible Magicとの提携で、同社のコンテンツ認識（ACR）技術採用のコンテンツマッチングを強化し、著作権侵害を防止している。

　Stability AIは同日、Stable Audioで生成されたトラックのライブストリーミングを公式YouTubeチャンネルで開始した。

Stability AI、音楽生成AI「Stable Audio」を2.0に更新　最長3分の作曲が可能に

関連記事

関連リンク

Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に

関連記事

関連リンク

Stability AI、音楽生成AI「Stable Audio」を2.0に更新　最長3分の作曲が可能に