無料で「Suno v4.5」超え? 音楽生成AI「ACE-Step v1.5」公開 個人向けGPUでも動作
AIスタートアップの米Timedomainは2月4日(日本時間)、音楽生成AI「ACE-Step v1.5」を公開した。「RTX 3090」など消費者向けのGPUでも動作し、同様の音楽生成AI「Suno」の前世代モデル「v4.5」を上回る性能とうたう。MITベースの独自ライセンスで、商用利用や配布、複製が可能だが、利用者に対して規約として芸術的誠実性や法令順守を求めている。
10秒から10分の音楽を最大8曲まで同時生成可能で、1000以上の楽器や50以上の言語によるボーカル音声を出力できる。既存の楽曲からカバー楽曲を作成したり、ボーカル音源から伴奏を生成したりといった使い方も可能。LoRAによるファインチューニングにも対応する。
内部的にはパラメータの異なる複数の言語モデルに加え、拡散モデルとTransformerを組み合わせたDiffusion Transformers(DiTs)がセットになっており、GPUのVRAMによって自動的に使い分ける仕組みという。言語モデルはいずれも「Qwen 3」ベースで、ユーザーの指示を基に歌詞や楽曲の構成図を作成し、DiTsが実際に音声を生成する。
GitHub上の記載によれば、GPU「NVIDIA A100」を使った場合は1曲(長さは記載なし)当たり2秒未満、RTX 3090でも10秒未満で生成可能。一方で、VRAM4GBのGPUでも動作するとしている。Timedomainによれば、学習データは全てパブリックドメインかロイヤルティーフリー、ライセンスを得た音源もしくは合成データという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
3
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
4
ゲームエンジン「Godot」AI生成コードを原則禁止へ レビュアー疲弊「機械と話したくない」
-
5
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
6
マイクロン、AI需要で広島工場増強へ起工式 1.5兆円投資
-
7
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
8
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
9
フィジカルAIに挑む日の丸連合、「Noetra」とは何か
-
10
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR