画像生成AIで知られる英Stability AIは9月13日(現地時間)、音楽とサウンド生成のためのAIモデル「Stable Audio」を発表した。Webアプリとして公開されており、無料で試せるが、本稿執筆現在、アクセスが集中して生成できない場合もある。
無料版では、最長45秒のトラックを生成してダウンロードできる。サブスクリプション版の「Professional」は月額11.99ドルで、商用プロジェクト用にダウンロード可能な90秒のトラックを生成できる。さらに応相談の「Enterprise」プランも用意している。
作曲するには、例えば「ポストロック、ギター、ドラムキット、ベース、ストリングス、多幸感、高揚感、ムーディー、流れるような、生々しい、壮大な、センチメンタルな、125BPM」などと入力する。以下の動画は、このプロンプトで生成した音楽という(1分31秒ある)。
このモデルは、音楽ライブラリのAudioSparxの音楽とメタデータを使ってトレーニングされている。「AudioSparxとの提携により、すべての関係者に経済的価値の創造的価値がもたらされる」という。
Stable Audioは、生成する音声の内容と長さを制御するアーキテクチャ「latent diffusion」を採用している。
画像を説明できるAI「Japanese InstructBLIP Alpha」 Stability AI Japanが公開
Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
Stability AI、スケッチを高度な画像に変換する「Stable Doodle」無償公開
チャットAI「StableLM」発表 オープンソースモデルで商用可 「Stable Diffusion」開発元から
チャットAI「Stable Chat(日本語版)」 画像AI「Stable Diffusion」開発元が着手Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR