Stability AI、音楽生成AI「Stable Audio」を2.0に更新 最長3分の作曲が可能に
画像生成AI「Stable Diffusion」で知られるStability AIはテキストで作曲できる生成AI「Stable Audio 2.0」を発表した。旧版では45秒までだった曲の長さが最長3分までに伸びた。16曲までは無料で作曲できる。
画像生成AI「Stable Diffusion」で知られる英Stability AIは4月3日(現地時間)、テキストで作曲できる生成AI「Stable Audio 2.0」を発表した。Stable AudioのWebサイトにログインすることで無料で利用できる他、間もなくStable Audio APIでも利用できるようになる見込みだ。
Stable Audioは、同社が昨年9月に発表した音楽生成AI。リリース当初の無料版では44.1kHzで最長45秒のトラックしか生成できなかったが、バージョンアップで最長3分のフルトラックの音楽を生成できるようになった。
テキストからだけでなく、音声からも作曲できる。オーディオサンプルをアップロードし、自然言語のプロンプトでサンプルをアレンジできる。
無料では、3分の音楽を20曲まで作れる。作った音楽を入力オーディオとして利用することもできる。
旧版同様に、モデルのトレーニングにはストック音楽サービスAudioSparxのデータを使った。AudioSparxに楽曲を登録しているアーティストは、Stable Audioのトレーニングをオプトアウトするオプションが提供されるようになった。
また、クリエイターの著作権保護のために、生成した音楽のアップロードについてはAudible Magicとの提携で、同社のコンテンツ認識(ACR)技術採用のコンテンツマッチングを強化し、著作権侵害を防止している。
Stability AIは同日、Stable Audioで生成されたトラックのライブストリーミングを公式YouTubeチャンネルで開始した。
関連記事
- 「Stable Diffusion」のStability AI、モスタクCEOが辞任
画像生成AI「Stable Diffusion」で知られる英Stability AIは、共同創業者でCEOのエマド・モスタク氏が辞任したと発表した。同氏は取締役からも退く。モスタク氏はXで「分散型AIを追求するため」と語った。 - Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開
Stability AIは、テキストから動画を生成するAIモデル「Stable Video Diffusion」のリサーチプレビュー版をGitHubで公開した。テキスト入力のためのWebツールを入手するにはウェイティングリストに登録する必要がある。 - Stability AI、テキストで作曲できる生成AI「Stable Audio」
Stabioity AIは、音楽生成AIモデル「Stable Audio」を公開した。Webアプリの無料版では、最長45秒のトラックを生成し、ダウンロードできる。 - Microsoft Copilot、音楽生成AI「Suno AI」のプラグインで作詞作曲が可能に
Microsoftのチャットボット「Copilot」で話題の音楽生成AI「Suno」をプラグインとして使えるようになった。Copilotに作りたい曲をテキストで依頼すると歌詞とメロディが生成される。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.