ITmedia NEWS > STUDIO >

Stability AI、テキストで作曲できる生成AI「Stable Audio」

» 2023年09月14日 07時37分 公開
[ITmedia]

 画像生成AIで知られる英Stability AIは9月13日(現地時間)、音楽とサウンド生成のためのAIモデル「Stable Audio」を発表した。Webアプリとして公開されており、無料で試せるが、本稿執筆現在、アクセスが集中して生成できない場合もある。

 stableaudio Stable Audio

 無料版では、最長45秒のトラックを生成してダウンロードできる。サブスクリプション版の「Professional」は月額11.99ドルで、商用プロジェクト用にダウンロード可能な90秒のトラックを生成できる。さらに応相談の「Enterprise」プランも用意している。

 plans 3つのプラン

 作曲するには、例えば「ポストロック、ギター、ドラムキット、ベース、ストリングス、多幸感、高揚感、ムーディー、流れるような、生々しい、壮大な、センチメンタルな、125BPM」などと入力する。以下の動画は、このプロンプトで生成した音楽という(1分31秒ある)。


 このモデルは、音楽ライブラリのAudioSparxの音楽とメタデータを使ってトレーニングされている。「AudioSparxとの提携により、すべての関係者に経済的価値の創造的価値がもたらされる」という。

 Stable Audioは、生成する音声の内容と長さを制御するアーキテクチャ「latent diffusion」を採用している。

 latent diffusion latent diffusionの概念図

Copyright © ITmedia, Inc. All Rights Reserved.