Tutoriels En Ligne | Prend En Charge 19 Langues Et Est Généré 15 Fois Plus Rapidement ! Le Modèle De Génération De Musique ACE-Step Est Désormais Disponible

Les modèles actuels de génération musicale sont confrontés à un compromis inhérent entre la vitesse de génération, la cohérence musicale et la contrôlabilité. Par exemple,Les modèles basés sur LLM (par exemple, Yue, SongGen) fonctionnent bien dans l'alignement des paroles, mais souffrent d'une vitesse d'inférence lente et d'artefacts structurels.D’autre part, les modèles de diffusion (par exemple, DiffRhythm), bien que permettant une synthèse plus rapide, manquent souvent de cohérence structurelle à long terme. En réponse à cela, la société d'intelligence artificielle StepFun et la plateforme de musique numérique ACE Studio ont lancé conjointement un modèle de génération de musique de base ACE-Step-v1-3.5B, qui a été rendu open source le 7 mai 2025.Le modèle peut synthétiser jusqu'à 4 minutes de musique en seulement 20 secondes sur un GPU NVIDIA A100, ce qui est 15 fois plus rapide que la méthode de base basée sur LLM.Tout en obtenant une excellente cohérence musicale et un alignement lyrique en termes de métriques mélodiques, harmoniques et rythmiques.
Comparé aux outils musicaux d'IA traditionnels, ACE-Step surmonte les principales limitations des méthodes existantes et atteint des performances optimales grâce à une conception architecturale globale.Il présente des avantages exceptionnels dans quatre aspects : la diversité des styles et des genres, la prise en charge multilingue, l'expressivité instrumentale et l'expressivité vocale.Sa version open source prend déjà en charge la saisie en 19 langues et conserve des détails acoustiques fins. Il prend en charge des mécanismes de contrôle avancés tels que le clonage vocal, l'édition des paroles, le mixage et la génération de pistes. De plus, il prend également en charge tous les styles de musique grand public, plusieurs styles de chant et la génération d'instruments intergenres. Il peut restaurer avec précision les caractéristiques du timbre des instruments de musique et générer de la musique multipiste avec des arrangements complexes.
Avec l'aide d'ACE-Step-v1-3.5B, il vous suffit de saisir des paramètres tels que le style musical et les paroles pour générer rapidement un clip musical de 30 secondes. Venez cliquer pour écouter~
* entrée de balise : funk, pop, soul, rock, mélodique, guitare, batterie, basse, clavier, percussions, 105 BPM, énergique, optimiste, groovy, vibrant, dynamique
à l'heure actuelle,« ACE-Step : modèle de base pour la génération de musique » a été lancé dans la section « Tutoriel » du site officiel d'HyperAI.Cliquez sur le lien ci-dessous pour découvrir le tutoriel de déploiement en un clic ⬇️
Lien du tutoriel :https://go.hyper.ai/tTmib
Essai de démonstration
1. Après avoir accédé à la page d'accueil de hyper.ai, sélectionnez la page « Tutoriel », sélectionnez « ACE-Step : Modèle de base pour la génération de musique » et cliquez sur « Exécuter ce tutoriel en ligne ».


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez les images « NVIDIA GeForce RTX 4090 » et « PyTorch ». La plateforme OpenBayes propose quatre méthodes de facturation. Vous pouvez choisir « Payer au fur et à mesure » ou « Quotidien/Hebdomadaire/Mensuel » selon vos besoins. Cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures de temps CPU gratuit !
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche de saut à côté de « Adresse API » pour accéder à la page de démonstration. Étant donné que le modèle est volumineux, il faut environ 3 minutes pour afficher l'interface WebUI, sinon « Bad Gateway » s'affichera. Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.

Démonstration d'effet
Le projet fournit des panneaux de création multitâches : onglet Text2Music, onglet Retake, onglet Repainting, onglet Edit et onglet Extend.
Les fonctions et les réglages des paramètres de chaque module sont brièvement présentés comme suit :
Onglet Text2Music
* Durée audio : définissez la durée de l'audio généré (-1 signifie une génération aléatoire)
* Tags : saisissez des balises descriptives, des genres musicaux ou des descriptions de scènes, séparés par des virgules
* Paroles : saisissez les paroles avec des balises de structure, telles que [couplet], [refrain], [pont]
* Paramètres de base : ajustez le nombre d'étapes d'inférence, le ratio de guidage et la valeur de départ
* Paramètres avancés : ajustez le type de planificateur, le type CFG, les paramètres ERG et d'autres paramètres
* Cliquez sur le bouton « Générer » pour créer de la musique basée sur le contenu d'entrée

Onglet Reprendre
Fonction:Régénérez la musique avec différentes valeurs de départ et produisez de légères variations, en ajustant les paramètres de variation pour contrôler à quel point la nouvelle version est différente de l'original
* variance : remplissez la variance
* reprendre les graines (par défaut Aucune) : remplir la graine de nombre aléatoire
* Cliquez sur le bouton « Reprendre » pour régénérer

Onglet Repeindre
Fonction:Régénérer sélectivement des passages spécifiques de musique
* variance : variance
* reprendre les graines (par défaut Aucune) : graines aléatoires
* Heure de début de la refonte : spécifie l'heure de début du paragraphe à régénérer
* Heure de fin de refonte : spécifie l'heure de fin du paragraphe à régénérer
* Repeindre la source : sélectionnez la source audio (text2music, last_repaint ou upload)
* Cliquez sur le bouton « Repeindre » pour régénérer

Onglet Modifier
Fonction:Contrôlez le degré de préservation de la chanson originale en ajustant les paramètres d'édition
* Modifier les balises : modifier les balises pour adapter la musique existante
* Modifier les paroles : modifier les paroles pour adapter la musique existante
* modifier les graines (par défaut Aucune) : modifier les graines aléatoires
* Type d'édition : Type d'édition, vous pouvez choisir le mode « only_lyrics » (conserver la mélodie originale) ou le mode « remix » (changer la mélodie)
* Heure de fin de refonte : spécifie l'heure de fin du paragraphe à régénérer
* edit_n_min : modifier la plage minimale
* edit_n_max : plage d'édition maximale
* Modifier la source : Modifier la ressource
* Cliquez sur le bouton « Modifier » pour modifier

Étendre l'onglet
Fonction:Ajouter un morceau de musique au début ou à la fin d'une musique existante
* modifier les graines (par défaut Aucune) : diffuser des graines aléatoires
* Longueur d'extension gauche : spécifie la longueur d'extension gauche
* Longueur d'extension droite : spécifie la longueur d'extension droite
* Étendre la source : sélectionnez la source audio qui doit être étendue
* Cliquez sur le bouton « Étendre » pour développer
