無料で「Suno v4.5」超え？　音楽生成AI「ACE-Step v1.5」公開　個人向けGPUでも動作

AIスタートアップの米Timedomainが音楽生成AI「ACE-Step v1.5」を公開した。「RTX 3090」など消費者向けのGPUでも動作し、同様の音楽生成AI「Suno」の前世代モデル「v4.5」を上回る性能とうたう。MITベースの独自ライセンスで、商用利用や配布、複製が可能だが、利用者に対して規約として芸術的誠実性や法令順守を求めている。

[ITmedia] PC用表示関連情報

LINE

Hatena

　AIスタートアップの米Timedomainは2月4日（日本時間）、音楽生成AI「ACE-Step v1.5」を公開した。「RTX 3090」など消費者向けのGPUでも動作し、同様の音楽生成AI「Suno」の前世代モデル「v4.5」を上回る性能とうたう。MITベースの独自ライセンスで、商用利用や配布、複製が可能だが、利用者に対して規約として芸術的誠実性や法令順守を求めている。

ベンチマーク（GitHubから引用、以下同）

　10秒から10分の音楽を最大8曲まで同時生成可能で、1000以上の楽器や50以上の言語によるボーカル音声を出力できる。既存の楽曲からカバー楽曲を作成したり、ボーカル音源から伴奏を生成したりといった使い方も可能。LoRAによるファインチューニングにも対応する。

　内部的にはパラメータの異なる複数の言語モデルに加え、拡散モデルとTransformerを組み合わせたDiffusion Transformers（DiTs）がセットになっており、GPUのVRAMによって自動的に使い分ける仕組みという。言語モデルはいずれも「Qwen 3」ベースで、ユーザーの指示を基に歌詞や楽曲の構成図を作成し、DiTsが実際に音声を生成する。

モデルの役割分担

アーキテクチャ

　GitHub上の記載によれば、GPU「NVIDIA A100」を使った場合は1曲（長さは記載なし）当たり2秒未満、RTX 3090でも10秒未満で生成可能。一方で、VRAM4GBのGPUでも動作するとしている。Timedomainによれば、学習データは全てパブリックドメインかロイヤルティーフリー、ライセンスを得た音源もしくは合成データという。

無料で「Suno v4.5」超え？　音楽生成AI「ACE-Step v1.5」公開　個人向けGPUでも動作

関連記事

関連リンク

無料で「Suno v4.5」超え？ 音楽生成AI「ACE-Step v1.5」公開 個人向けGPUでも動作

関連記事

関連リンク

無料で「Suno v4.5」超え？　音楽生成AI「ACE-Step v1.5」公開　個人向けGPUでも動作