3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page. Avec Safari, l'audio peut ne pas être lu directement ; il doit être téléchargé avant de pouvoir être lu.

*Ce tutoriel vous permet de choisir entre la génération audio en mode solo (Single) et la génération audio de dialogue à deux joueurs (Role) dans le « Mode d'entrée audio ».

HyperAI

Exécuter ce Notebook

Date

il y a 2 mois

Taille

8.4 MB

Balises

Text-to-Audio

Licence

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

URL du document

www.open-moss.com

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte RTX 5090 comme ressource.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page. Avec Safari, l'audio peut ne pas être lu directement ; il doit être téléchargé avant de pouvoir être lu.

*Ce tutoriel vous permet de choisir entre la génération audio en mode solo (Single) et la génération audio de dialogue à deux joueurs (Role) dans le « Mode d'entrée audio ».

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a 2 mois

Taille

8.4 MB

Balises

Text-to-Audio

Licence

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

URL du document

www.open-moss.com

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte RTX 5090 comme ressource.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 2 à 3 minutes avant d'actualiser la page. Avec Safari, l'audio peut ne pas être lu directement ; il doit être téléchargé avant de pouvoir être lu.

*Ce tutoriel vous permet de choisir entre la génération audio en mode solo (Single) et la génération audio de dialogue à deux joueurs (Role) dans le « Mode d'entrée audio ».

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Associé Notebooks

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

il y a 3 mois

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

il y a 2 mois

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

il y a 2 mois

MAGE : Générateur De Gènes D’anticorps Monoclonaux

il y a 2 mois

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

il y a 2 mois

LongCat-Image : Un Système De Génération D’images Bilingue Piloté Par Texte

il y a 2 mois

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

il y a 3 mois

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

il y a un mois

kyutai-tts-1.6 b-en_fr Génération Audio

il y a un mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

MOSS : Génération De Dialogues texte-parole

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Informations sur la citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MOSS : Génération De Dialogues texte-parole

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Informations sur la citation

Associé Notebooks

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

MAGE : Générateur De Gènes D’anticorps Monoclonaux

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

LongCat-Image : Un Système De Génération D’images Bilingue Piloté Par Texte

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

kyutai-tts-1.6 b-en_fr Génération Audio

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MOSS : Génération De Dialogues texte-parole

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Informations sur la citation

Associé Notebooks

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

MAGE : Générateur De Gènes D’anticorps Monoclonaux

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

LongCat-Image : Un Système De Génération D’images Bilingue Piloté Par Texte

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

kyutai-tts-1.6 b-en_fr Génération Audio

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

MAGE : Générateur De Gènes D’anticorps Monoclonaux

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

LongCat-Image : Un Système De Génération D’images Bilingue Piloté Par Texte

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

kyutai-tts-1.6 b-en_fr Génération Audio

Associé Notebooks

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

MAGE : Générateur De Gènes D’anticorps Monoclonaux

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

LongCat-Image : Un Système De Génération D’images Bilingue Piloté Par Texte

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

kyutai-tts-1.6 b-en_fr Génération Audio