il y a 7 mois

Résumé

Dans cet article, nous proposons WaveGlow : un réseau basé sur les flux capable de générer une parole de haute qualité à partir de mél-spectrogrammes. WaveGlow combine des idées issues de Glow et de WaveNet afin d'offrir une synthèse audio rapide, efficace et de haute qualité, sans nécessiter une régression automatique. WaveGlow est mis en œuvre à l'aide d'un seul réseau, formé en utilisant une seule fonction de coût : maximiser la vraisemblance des données d'entraînement, ce qui rend la procédure d'entraînement simple et stable. Notre implémentation PyTorch produit des échantillons audio à un taux supérieur à 500 kHz sur une GPU NVIDIA V100. Les Scores Moyens d'Opinion (Mean Opinion Scores) montrent qu'il fournit une qualité audio comparable à celle de la meilleure implémentation publiquement disponible de WaveNet. L'ensemble du code sera rendu publiquement accessible en ligne.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Text-to-Speech

Synthèse

Apprentissage Profond

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Text-to-Speech

Synthèse

Apprentissage Profond

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

WaveGlow : Un réseau génératif basé sur les flux pour la synthèse vocale

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

WaveGlow : Un réseau génératif basé sur les flux pour la synthèse vocale

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

WaveGlow : Un réseau génératif basé sur les flux pour la synthèse vocale

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters