HyperAIHyperAI

Command Palette

Search for a command to run...

g2pM : Un Paquet de Conversion Graphème-Phonème Basé sur un Nouveau Jeu de Données de Benchmark Ouvert pour le Chinois Mandarine

Kyubyong Park Seanie Lee

Résumé

La conversion des graphèmes en phonèmes du chinois (G2P) est un élément essentiel des systèmes de synthèse vocale du mandarin (TTS). L'un des plus grands défis de la conversion G2P en chinois réside dans la désambiguïsation de la prononciation des polyphones, c'est-à-dire des caractères ayant plusieurs prononciations. Bien que de nombreux efforts académiques aient été déployés pour y remédier, il n'existe à ce jour aucun jeu de données ouvert qui puisse servir de référence standard pour une comparaison équitable. De plus, la plupart des systèmes rapportés sont difficiles à utiliser pour les chercheurs ou les praticiens souhaitant convertir le texte chinois en pinyin selon leurs besoins. Guidés par ces constatations, nous présentons dans cette étude un nouveau jeu de données de référence composé de plus de 99 000 phrases pour la désambiguïsation des polyphones chinois. Nous entraînons un modèle neuronal simple sur ce jeu de données et constatons qu'il surpasses les autres systèmes G2P existants. Enfin, nous avons empaqueté notre projet et nous le partageons sur PyPi.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp