Stability AI、テキストで作曲できる生成AI「Stable Audio」

Stabioity AIは、音楽生成AIモデル「Stable Audio」を公開した。Webアプリの無料版では、最長45秒のトラックを生成し、ダウンロードできる。

[ITmedia] PC用表示関連情報

LINE

Hatena

　画像生成AIで知られる英Stability AIは9月13日（現地時間）、音楽とサウンド生成のためのAIモデル「Stable Audio」を発表した。Webアプリとして公開されており、無料で試せるが、本稿執筆現在、アクセスが集中して生成できない場合もある。

Stable Audio

　無料版では、最長45秒のトラックを生成してダウンロードできる。サブスクリプション版の「Professional」は月額11.99ドルで、商用プロジェクト用にダウンロード可能な90秒のトラックを生成できる。さらに応相談の「Enterprise」プランも用意している。

3つのプラン

　作曲するには、例えば「ポストロック、ギター、ドラムキット、ベース、ストリングス、多幸感、高揚感、ムーディー、流れるような、生々しい、壮大な、センチメンタルな、125BPM」などと入力する。以下の動画は、このプロンプトで生成した音楽という（1分31秒ある）。

　このモデルは、音楽ライブラリのAudioSparxの音楽とメタデータを使ってトレーニングされている。「AudioSparxとの提携により、すべての関係者に経済的価値の創造的価値がもたらされる」という。

　Stable Audioは、生成する音声の内容と長さを制御するアーキテクチャ「latent diffusion」を採用している。

latent diffusionの概念図