HyperAI

Démonstration En Ligne De La Synthèse Audio GPT-SoVITS

1. Description fonctionnelle

Il ne faut que dix minutes, en utilisant 30 à 1 minute d'audio, pour utiliser l'IA pour cloner le son souhaité. Du déploiement de l’environnement à la fin de la formation, l’opération se fait en un clic et peut être réalisée en dix minutes.

Remarque : la formation en un clic que j'ai réalisée ne prend actuellement en charge que le chinois. Si vous souhaitez apprendre le japonais ou l'anglais, vous devez activer l'interface Web.

La méthode consiste à remplacer le python run_all.py dans le code d'exécution run.ipynb par python webui.py

2. Tutoriel vidéo

https://www.bilibili.com/video/BV1WC411W79t

3. Méthode de fonctionnement

1. Ouvrez run.ipynb

Cliquez sur Exécuter -> Exécuter toutes les cellules pour démarrer le programme, configurer automatiquement l'environnement et démarrer le service.

2. Ouvrez l'URL publique de sortie

3. Choisissez le type de données en fonction de votre audio

4. Cliquez pour commencer la formation

Cliquez pour voir à quelle étape le processus a atteint au premier plan, et vous pouvez également voir la sortie du journal en arrière-plan.

5. Ouvrez l'adresse API

Lorsque le front-end indique que la prédiction est activée

Adresse API ouverte :

6. Clonage vocal

Sélectionnez le modèle formé, entrez votre texte et amusez-vous.

4. Audio personnalisé

1. Rechercher des ensembles de données et créer de nouveaux ensembles de données

2. Télécharger les données audio

3. Modifiez la configuration et démarrez

4. Une nouvelle adresse d'entrée est liée

5. Ouvrez l'espace de travail

De cette façon, vous pouvez voir le nouvel ensemble de données lié dans la barre latérale à droite.

6. Formation pour remplir la nouvelle adresse liée