Modèle De Génération De Parole Dialectale De Niveau Production Step-Audio-TTS-3B


1. Introduction au tutoriel
Step-Audio est le premier système de dialogue vocal en temps réel open source de niveau produit du secteur qui intègre la compréhension de la parole et le contrôle de la génération. Il a été open source par l'équipe Stepfun-AI en 2025. Il prend en charge la génération multilingue (comme le chinois, l'anglais, le japonais), les émotions vocales (comme le bonheur, la tristesse), les dialectes (comme le cantonais, le dialecte du Sichuan), la vitesse de parole et le style rythmique contrôlables, et prend en charge le RAP et le fredonnement, etc.
本教程以 Step-Audio-TTS-3B 作为演示,算力资源采用「单卡 RTX4090」。
Fonctions de support :
- Synthèse vocale générale
Préréglez le personnage vocal par défaut du site Web officiel Tingting et ajoutez la voix de Nezha, prenez en charge la génération multilingue, l'émotion, le dialecte et d'autres paramètres
- Synthèse musicale
Préréglez le personnage vocal par défaut du site officiel Tingting et ajoutez la voix de Nezha, prenez en charge le RAP et le fredonnement
- Clonage de voix
Aider les utilisateurs à télécharger des fichiers audio personnalisés, à saisir le contenu textuel de l'audio et à définir le nom du rôle selon les besoins
2. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web (si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Veuillez patienter environ 1 minute et réessayer.)

2. Après avoir accédé à la page Web, vous pouvez effectuer une synthèse vocale multifonctionnelle
1. Synthèse vocale générale

Synthèse vocale générale
2. Mode RAP/Fredonnement

Mode RAP / Hum
3. Clonage vocal

Clonage de voix
Conseils : Vous pouvez générer rapidement l'effet de clonage sonore de RAP ou de fredonnement en (RAP) ou (fredonnement) avant le texte à générer.
Échange et discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓