Online-Tutorials | Unterstützt 19 Sprachen Und Wird 15-mal Schneller Generiert! Das ACE-Step-Musikgenerierungsmodell Ist Jetzt Verfügbar

Aktuelle Modelle zur Musikgenerierung stehen vor einem inhärenten Kompromiss zwischen Generierungsgeschwindigkeit, musikalischer Kohärenz und Steuerbarkeit. Zum Beispiel,Auf LLM basierende Modelle (z. B. Yue, SongGen) erzielen bei der Ausrichtung von Liedtexten gute Ergebnisse, weisen jedoch eine langsame Inferenzgeschwindigkeit und strukturelle Artefakte auf.Auf der anderen Seite mangelt es Diffusionsmodellen (z. B. DiffRhythm) zwar an einer schnelleren Synthese, ihnen fehlt jedoch häufig die strukturelle Kohärenz über große Entfernungen. Als Reaktion darauf haben das auf künstliche Intelligenz spezialisierte Unternehmen StepFun und die digitale Musikplattform ACE Studio gemeinsam ein grundlegendes Musikgenerierungsmodell namens ACE-Step-v1-3.5B auf den Markt gebracht, das am 7. Mai 2025 als Open Source veröffentlicht wurde.Das Modell kann auf einer NVIDIA A100 GPU in nur 20 Sekunden bis zu 4 Minuten Musik synthetisieren, was 15-mal schneller ist als die LLM-basierte Basismethode.Dabei wird eine hervorragende musikalische Kohärenz und lyrische Übereinstimmung in Bezug auf melodische, harmonische und rhythmische Metrik erreicht.
Im Vergleich zu herkömmlichen KI-Musiktools überwindet ACE-Step die wichtigsten Einschränkungen bestehender Methoden und erreicht durch ein umfassendes architektonisches Design eine optimale Leistung.Es bietet herausragende Vorteile in vier Aspekten: verschiedene Stile und Genres, Unterstützung mehrerer Sprachen, instrumentale Ausdruckskraft und vokale Ausdruckskraft.Seine Open-Source-Version unterstützt bereits die Eingabe in 19 Sprachen und behält feine akustische Details bei. Es unterstützt erweiterte Steuerungsmechanismen wie Stimmenklonen, Songtextbearbeitung, Mischen und Trackgenerierung. Darüber hinaus unterstützt es auch alle gängigen Musikstile, mehrere Gesangsstile und die genreübergreifende Instrumentalgenerierung. Es kann die Klangfarbeneigenschaften von Musikinstrumenten präzise wiederherstellen und Mehrspurmusik mit komplexen Arrangements erzeugen.
Mithilfe von ACE-Step-v1-3.5B müssen Sie lediglich Parameter wie Musikstil und Liedtext eingeben, um schnell einen 30-sekündigen Musikclip zu erstellen. Kommen Sie und klicken Sie, um zuzuhören~
* Tag-Eingabe: Funk, Pop, Soul, Rock, melodisch, Gitarre, Schlagzeug, Bass, Keyboard, Percussion, 105 BPM, energisch, optimistisch, groovig, lebendig, dynamisch
derzeit,„ACE-Step: Basismodell zur Musikgenerierung“ wurde im Abschnitt „Tutorial“ der offiziellen Website von HyperAI veröffentlicht.Klicken Sie auf den Link unten, um das Tutorial zur Bereitstellung mit einem Klick zu erleben ⬇️
Link zum Tutorial:https://go.hyper.ai/tTmib
Demolauf
1. Nachdem Sie die Homepage von hyper.ai aufgerufen haben, wählen Sie die Seite „Tutorial“, wählen Sie „ACE-Step: Basismodell für die Musikgenerierung“ und klicken Sie auf „Dieses Tutorial online ausführen“.


2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wählen Sie die Bilder „NVIDIA GeForce RTX 4090“ und „PyTorch“ aus. Die OpenBayes-Plattform bietet vier Abrechnungsmethoden. Sie können je nach Bedarf zwischen „Pay as you go“ oder „Täglich/Wöchentlich/Monatlich“ wählen. Klicken Sie auf „Weiter“. Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!
Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. Warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 2 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen. Da das Modell groß ist, dauert es etwa 3 Minuten, bis die WebUI-Schnittstelle angezeigt wird, andernfalls wird „Bad Gateway“ angezeigt. Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.

Effektdemonstration
Das Projekt bietet Multitasking-Erstellungsfelder: Registerkarte „Text2Music“, Registerkarte „Retake“, Registerkarte „Repainting“, Registerkarte „Edit“ und Registerkarte „Extend“.
Die Funktionen und Parametereinstellungen der einzelnen Module werden im Folgenden kurz vorgestellt:
Registerkarte „Text2Music“
* Audiodauer: Legen Sie die Dauer des generierten Audios fest (-1 bedeutet zufällige Generierung)
* Tags: Geben Sie beschreibende Tags, Musikgenres oder Szenenbeschreibungen ein, getrennt durch Kommas
* Liedtext: Geben Sie Liedtexte mit Struktur-Tags ein, wie etwa [Vers], [Refrain], [Bridge].
* Grundeinstellungen: Passen Sie die Anzahl der Inferenzschritte, das Führungsverhältnis und den Startwert an
* Erweiterte Einstellungen: Feinabstimmung von Scheduler-Typ, CFG-Typ, ERG-Einstellungen und anderen Parametern
* Klicken Sie auf die Schaltfläche "Generieren", um Musik basierend auf dem Eingabeinhalt zu erstellen

Registerkarte „Wiederholen“
Funktion:Regenerieren Sie die Musik mit unterschiedlichen Seed-Werten und erzeugen Sie leichte Variationen. Passen Sie die Variationsparameter an, um zu steuern, wie sehr sich die neue Version vom Original unterscheidet.
* Varianz: Tragen Sie die Varianz ein
* Seeds erneut aufnehmen (Standard: Keine): Füllen Sie den Seed der Zufallszahl aus
* Klicken Sie auf die Schaltfläche "Wiederholen", um zu regenerieren

Registerkarte „Neulackierung“
Funktion:Selektives Regenerieren bestimmter Musikpassagen
* Varianz: Varianz
* Samen erneut aufnehmen (Standard: Keine): zufällige Samen
* Repaint Start Time: Gibt die Startzeit des zu regenerierenden Absatzes an
* Repaint End Time: Gibt die Endzeit des zu regenerierenden Absatzes an
* Repaint-Quelle: Wählen Sie das Quell-Audio (text2music, last_repaint oder upload)
* Klicken Sie auf die Schaltfläche "Neu streichen", um zu regenerieren

Registerkarte „Bearbeiten“
Funktion:Kontrollieren Sie den Grad der Erhaltung des Originalsongs durch Anpassen der Bearbeitungsparameter
* Tags bearbeiten: Ändern Sie Tags, um vorhandene Musik anzupassen
* Liedtexte bearbeiten: Ändern Sie die Liedtexte, um vorhandene Musik anzupassen
* Seeds bearbeiten (Standard: Keine): Zufällige Seeds bearbeiten
* Bearbeitungstyp: Bearbeitungstyp, Sie können den Modus „only_lyrics“ (die Originalmelodie beibehalten) oder den Modus „remix“ (die Melodie ändern) wählen.
* Repaint End Time: Gibt die Endzeit des zu regenerierenden Absatzes an
* edit_n_min: Mindestbereich bearbeiten
* edit_n_max: maximaler Bearbeitungsbereich
* Quelle bearbeiten: Ressource bearbeiten
* Klicken Sie zum Bearbeiten auf die Schaltfläche "Bearbeiten"

Registerkarte „Erweitern“
Funktion:Fügen Sie am Anfang oder Ende der vorhandenen Musik ein Musikstück hinzu
* Seeds bearbeiten (Standard: Keine): Zufällige Seeds verteilen
* Left Extend Length: Gibt die linke Verlängerungslänge an
* Rechte Verlängerungslänge: Gibt die rechte Verlängerungslänge an
* Quelle erweitern: Wählen Sie die Audioquelle aus, die erweitert werden soll
* Klicken Sie auf die Schaltfläche "Erweitern", um zu erweitern
