ACE-Step: 音楽生成の基本モデル

1. チュートリアルの概要

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX 4090 カードです。
ACE-Step-v1-3.5Bは、人工知能企業StepFunとデジタル音楽プラットフォームACE Studioによって共同開発され、2025年5月7日にオープンソース化されました。このモデルは、A100 GPUでわずか20秒で最大4分の音楽を合成でき、LLMベースのベースラインよりも15倍高速です。また、メロディー、ハーモニー、リズムのメトリクスに関して優れた音楽の一貫性と歌詞のアラインメントを実現します。さらに、このモデルは微細な音響の詳細を保持し、音声の複製、歌詞の編集、リミックス、トラック生成などの高度な制御メカニズムを可能にします。
2. コア機能

多様なスタイルとジャンル
- すべての主流の音楽スタイルをサポートし、短いタグ/説明テキスト/使用シナリオなど、さまざまな形式で入力できます。
- さまざまなタイプ(ジャズのスタンダードサックスとスウィングリズムなど)に応じて、楽器の組み合わせとスタイル特性を自動的に適応させることができます。
多言語サポート
- 19言語の入力をサポートしており、上位10言語は次のとおりです:🇺🇸英語、🇨🇳中国語、🇷🇺ロシア語、🇪🇸スペイン語、🇯🇵日本語、🇩🇪ドイツ語、🇫🇷フランス語、🇵🇹ポルトガル語、🇮🇹イタリア語、🇰🇷韓国語
楽器による表現
- ジャンルを超えた楽器生成をサポートし、楽器の音色特性(ピアノのペダル共鳴やギターのスライドノイズなど)を正確に復元できます。
- パート間のハーモニーとリズムの統一性を維持しながら、複雑なアレンジでマルチトラックの音楽を生成します。
- 楽器の演奏テクニック(弦楽器のビブラート、金管楽器のタンギングなど)に自動的に適応します
声の表現力
- 複数の歌唱スタイル(ポピュラー歌唱、ベルカント、オペラ歌唱など)をサポート
- 感情表現の強さをコントロールする能力(例:抑制された低音の歌唱と爆発的な高音の歌唱)
3. 操作手順
1. コンテナを起動します
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. 使用例
使用ガイドライン
Safari ブラウザを使用する場合、オーディオは直接再生されない場合があり、再生する前にダウンロードする必要があります。
このプロジェクトは、Text2Music タブ、Retake タブ、Repainting タブ、Edit タブ、Extend タブというマルチタスク作成パネルを提供します。
各モジュールの機能は次のとおりです。
Text2Musicタブ
- 入力フィールド
- タグ: 説明タグ、音楽ジャンル、シーンの説明をカンマで区切って入力します
- 歌詞: [バース]、[コーラス]、[ブリッジ]などの構造タグ付きの歌詞を入力します。
- オーディオの長さ: 生成されるオーディオの長さを設定します (-1 はランダム生成を意味します)
- 設定
- 基本設定: 推論ステップ数、ガイダンス比率、シード値を調整します
- 詳細設定: スケジューラタイプ、CFGタイプ、ERG設定、その他のパラメータを微調整します
- 世代
- 「生成」ボタンをクリックすると、入力した内容に基づいて音楽が作成されます。


結果を生成する

再受験タブ
- 異なるシード値で音楽を再生成し、わずかなバリエーションを作成します
- バリエーションパラメータを調整して、新しいバージョンがオリジナルとどの程度異なるかを制御します。

再描画タブ
- 特定の音楽部分を選択的に再生する
- 再生成するセグメントの開始時間と終了時間を指定します
- ソースオーディオ(text2music、last_repaint、またはアップロード)を選択します

編集タブ
- タブや歌詞を変更して既存の音楽をアレンジする
- 「only_lyrics」モード(元のメロディーを保持)または「remix」モード(メロディーを変更)を選択できます。
- 編集パラメータを調整して、元の曲の保存度合いを制御します

タブを拡張
- 既存の音楽の最初または最後に音楽を追加する
- 左側と右側の延長期間を指定します
- 拡張する必要があるソースオーディオを選択します

4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
Githubユーザーに感謝 スーパーヤン このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。
@misc{gong2025acestep,
title={ACE-Step: A Step Towards Music Generation Foundation Model},
author={Junmin Gong, Wenxiao Zhao, Sen Wang, Shengyuan Xu, Jing Guo},
howpublished={\url{https://github.com/ace-step/ACE-Step}},
year={2025},
note={GitHub repository}
}