検索
速報

Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に

画像生成AI「Stable Diffusion」で知られるStability AIはテキストで作曲できる生成AI「Stable Audio 2.0」を発表した。旧版では45秒までだった曲の長さが最長3分までに伸びた。16曲までは無料で作曲できる。

Share
Tweet
LINE
Hatena

 画像生成AI「Stable Diffusion」で知られる英Stability AIは4月3日(現地時間)、テキストで作曲できる生成AI「Stable Audio 2.0」を発表した。Stable AudioのWebサイトにログインすることで無料で利用できる他、間もなくStable Audio APIでも利用できるようになる見込みだ。

 audio 1
Stable Audio 2.0のWebアプリ版

 Stable Audioは、同社が昨年9月に発表した音楽生成AI。リリース当初の無料版では44.1kHzで最長45秒のトラックしか生成できなかったが、バージョンアップで最長3分のフルトラックの音楽を生成できるようになった。

 テキストからだけでなく、音声からも作曲できる。オーディオサンプルをアップロードし、自然言語のプロンプトでサンプルをアレンジできる。

 無料では、3分の音楽を20曲まで作れる。作った音楽を入力オーディオとして利用することもできる。

 audio 2
作曲例

 旧版同様に、モデルのトレーニングにはストック音楽サービスAudioSparxのデータを使った。AudioSparxに楽曲を登録しているアーティストは、Stable Audioのトレーニングをオプトアウトするオプションが提供されるようになった。

 また、クリエイターの著作権保護のために、生成した音楽のアップロードについてはAudible Magicとの提携で、同社のコンテンツ認識(ACR)技術採用のコンテンツマッチングを強化し、著作権侵害を防止している。

 Stability AIは同日、Stable Audioで生成されたトラックのライブストリーミングを公式YouTubeチャンネルで開始した。


Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る