無料で「Suno v4.5」超え? 音楽生成AI「ACE-Step v1.5」公開 個人向けGPUでも動作
AIスタートアップの米Timedomainが音楽生成AI「ACE-Step v1.5」を公開した。「RTX 3090」など消費者向けのGPUでも動作し、同様の音楽生成AI「Suno」の前世代モデル「v4.5」を上回る性能とうたう。MITベースの独自ライセンスで、商用利用や配布、複製が可能だが、利用者に対して規約として芸術的誠実性や法令順守を求めている。
AIスタートアップの米Timedomainは2月4日(日本時間)、音楽生成AI「ACE-Step v1.5」を公開した。「RTX 3090」など消費者向けのGPUでも動作し、同様の音楽生成AI「Suno」の前世代モデル「v4.5」を上回る性能とうたう。MITベースの独自ライセンスで、商用利用や配布、複製が可能だが、利用者に対して規約として芸術的誠実性や法令順守を求めている。
10秒から10分の音楽を最大8曲まで同時生成可能で、1000以上の楽器や50以上の言語によるボーカル音声を出力できる。既存の楽曲からカバー楽曲を作成したり、ボーカル音源から伴奏を生成したりといった使い方も可能。LoRAによるファインチューニングにも対応する。
内部的にはパラメータの異なる複数の言語モデルに加え、拡散モデルとTransformerを組み合わせたDiffusion Transformers(DiTs)がセットになっており、GPUのVRAMによって自動的に使い分ける仕組みという。言語モデルはいずれも「Qwen 3」ベースで、ユーザーの指示を基に歌詞や楽曲の構成図を作成し、DiTsが実際に音声を生成する。
GitHub上の記載によれば、GPU「NVIDIA A100」を使った場合は1曲(長さは記載なし)当たり2秒未満、RTX 3090でも10秒未満で生成可能。一方で、VRAM4GBのGPUでも動作するとしている。Timedomainによれば、学習データは全てパブリックドメインかロイヤルティーフリー、ライセンスを得た音源もしくは合成データという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
さくら、データセンターに「NVIDIA H100」を2000基整備 “生成AI需要増”で計画を前倒し
さくらインターネットは、北海道にある石狩データセンターに「NVIDIA H100 Tensor コア GPU」を2016基整備したと発表した。
AI生成の曲を見破る「Spotifake」登場 AI曲の大量流通は「真摯に音楽と向き合うアーティストに不公平」
音楽生成などのAI技術の開発を手掛けるQosmoは、生成AIが作った楽曲を判定できるツール「Spotifake」を公開した。音楽ストリーミングサービス「Spotify」で聞ける楽曲のうち、AI音楽ジェネレーター「Suno」や「Udio」で生成したものを検出できるという。
OpenAIの「オープンなAI(gpt-oss-120b)」はGPUサーバじゃないと動かない?→約30万円の自作PCで動かしてみた
米OpenAIの「オープンなAI」の実行にはサーバ向けのGPU「H100」が必要ということだったので、約30万円の自作PCで実行してみた。
国産AIスタートアップ・PFNが“生成AI向けプロセッサ”独自開発、2026年提供へ 「GPUの10倍高速で省電力」
AIスタートアップ・Preferred Networksは、大規模言語モデルなどの生成AI向けプロセッサ「MN-Core L1000」の独自開発を始めると発表した。
NPUだけでOpenAIのLLM「gpt-oss」が動く! 速度や消費電力を計測してみた
NPUを搭載していてもLLMの実行についてはあまり良い話がなかったAI PCだが、AMDのNPUではOpenAIの「gpt-oss」を実行できるようになった。NPUで実行した場合の文章生成速度や消費電力などを計測してみた。


