il y a 7 mois

Résumé

Bien que de nombreux systèmes de synthèse vocale fondés sur des réseaux de neurones profonds soient soigneusement évalués et mis gratuitement à disposition pour l’anglais, les modèles destinés aux langues ayant beaucoup moins de locuteurs actifs, comme l’allemand, sont rarement entraînés et, dans la majorité des cas, non publiés pour une utilisation courante. Ce travail aborde les défis spécifiques liés à l’entraînement de modèles de synthèse vocale texte-parole pour la langue allemande, notamment le choix des jeux de données et le prétraitement des données, et présente le processus d’entraînement de plusieurs modèles d’un système end-to-end de synthèse vocale basé sur une combinaison de Tacotron 2 et de Multi-Band MelGAN. Toutes les architectures de modèles ont été évaluées selon le score moyen d’opinion (MOS), révélant des résultats comparables à ceux des modèles existants dans la littérature, entraînés et évalués sur des jeux de données en anglais. En outre, des analyses empiriques ont permis d’identifier des aspects distincts influençant la qualité de ces systèmes, fondés sur l’expérience subjective des utilisateurs. Tous les modèles entraînés sont désormais mis à disposition pour une utilisation publique.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Text-to-Speech

Synthèse

Apprentissage Profond

René Peinl Pascal Puchtler Johannes Wirth

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Text-to-Speech

Synthèse

Apprentissage Profond

René Peinl Pascal Puchtler Johannes Wirth

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Synthèse vocale neuronale en allemand

René Peinl Pascal Puchtler Johannes Wirth

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Synthèse vocale neuronale en allemand

René Peinl Pascal Puchtler Johannes Wirth

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Synthèse vocale neuronale en allemand

René Peinl Pascal Puchtler Johannes Wirth

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters