Date

il y a 2 ans

Taille

22.53 GB

Balises

1. Description fonctionnelle

Remarque : la formation en un clic que j'ai réalisée ne prend actuellement en charge que le chinois. Si vous souhaitez apprendre le japonais ou l'anglais, vous devez activer l'interface Web.

La méthode consiste à remplacer le python run_all.py dans le code d'exécution run.ipynb par python webui.py

2. Tutoriel vidéo

https://www.bilibili.com/video/BV1WC411W79t

3. Méthode de fonctionnement

1. Ouvrez run.ipynb

Cliquez sur Exécuter -> Exécuter toutes les cellules pour démarrer le programme, configurer automatiquement l'environnement et démarrer le service.

2. Ouvrez l'URL publique de sortie

3. Choisissez le type de données en fonction de votre audio

4. Cliquez pour commencer la formation

Cliquez pour voir à quelle étape le processus a atteint au premier plan, et vous pouvez également voir la sortie du journal en arrière-plan.

5. Ouvrez l'adresse API

Lorsque le front-end indique que la prédiction est activée

Adresse API ouverte :

6. Clonage vocal

Sélectionnez le modèle formé, entrez votre texte et amusez-vous.

4. Audio personnalisé

1. Rechercher des ensembles de données et créer de nouveaux ensembles de données

2. Télécharger les données audio

3. Modifiez la configuration et démarrez

4. Une nouvelle adresse d'entrée est liée

5. Ouvrez l'espace de travail

De cette façon, vous pouvez voir le nouvel ensemble de données lié dans la barre latérale à droite.

6. Formation pour remplir la nouvelle adresse liée

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

il y a 20 jours

Démo De Génération 3D TRELLIS.2

il y a 18 jours

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

il y a 2 mois

Déploiement En Un Clic Du Modèle SmolLM3-3B

il y a 2 mois

Déploiement En Un Clic De DeepSeek-R1-70B

il y a 3 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a 2 ans

Taille

22.53 GB

Balises

Classification Audio

Text-to-Audio

1. Description fonctionnelle

Remarque : la formation en un clic que j'ai réalisée ne prend actuellement en charge que le chinois. Si vous souhaitez apprendre le japonais ou l'anglais, vous devez activer l'interface Web.

La méthode consiste à remplacer le python run_all.py dans le code d'exécution run.ipynb par python webui.py

2. Tutoriel vidéo

https://www.bilibili.com/video/BV1WC411W79t

3. Méthode de fonctionnement

1. Ouvrez run.ipynb

Cliquez sur Exécuter -> Exécuter toutes les cellules pour démarrer le programme, configurer automatiquement l'environnement et démarrer le service.

2. Ouvrez l'URL publique de sortie

3. Choisissez le type de données en fonction de votre audio

4. Cliquez pour commencer la formation

Cliquez pour voir à quelle étape le processus a atteint au premier plan, et vous pouvez également voir la sortie du journal en arrière-plan.

5. Ouvrez l'adresse API

Lorsque le front-end indique que la prédiction est activée

Adresse API ouverte :

6. Clonage vocal

Sélectionnez le modèle formé, entrez votre texte et amusez-vous.

4. Audio personnalisé

1. Rechercher des ensembles de données et créer de nouveaux ensembles de données

2. Télécharger les données audio

3. Modifiez la configuration et démarrez

4. Une nouvelle adresse d'entrée est liée

5. Ouvrez l'espace de travail

De cette façon, vous pouvez voir le nouvel ensemble de données lié dans la barre latérale à droite.

6. Formation pour remplir la nouvelle adresse liée

Associé Notebooks

Tutoriel Sur Le Compilateur Triton

il y a 14 jours

Tutoriel TVM 0.22.0

il y a 14 jours

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

il y a 2 mois

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

il y a 20 jours

Démo De Génération 3D TRELLIS.2

il y a 18 jours

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

il y a 2 mois

Déploiement En Un Clic Du Modèle SmolLM3-3B

il y a 2 mois

Déploiement En Un Clic De DeepSeek-R1-70B

il y a 3 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Démonstration En Ligne De La Synthèse Audio GPT-SoVITS

1. Description fonctionnelle

2. Tutoriel vidéo

3. Méthode de fonctionnement

4. Audio personnalisé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Démonstration En Ligne De La Synthèse Audio GPT-SoVITS

1. Description fonctionnelle

2. Tutoriel vidéo

3. Méthode de fonctionnement

4. Audio personnalisé

Associé Notebooks

Tutoriel Sur Le Compilateur Triton

Tutoriel TVM 0.22.0

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

Démo De Génération 3D TRELLIS.2

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Démonstration En Ligne De La Synthèse Audio GPT-SoVITS

1. Description fonctionnelle

2. Tutoriel vidéo

3. Méthode de fonctionnement

4. Audio personnalisé

Associé Notebooks

Tutoriel Sur Le Compilateur Triton

Tutoriel TVM 0.22.0

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

Démo De Génération 3D TRELLIS.2

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Tutoriel Sur Le Compilateur Triton

Tutoriel TVM 0.22.0

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

Démo De Génération 3D TRELLIS.2

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Associé Notebooks

Tutoriel Sur Le Compilateur Triton

Tutoriel TVM 0.22.0

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

Démo De Génération 3D TRELLIS.2

SoulX-Podcast : Génération Vocale De Textes Longs De Qualité Podcast Pour Plusieurs dialectes.

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX