g2pM : Un Paquet de Conversion Graphème-Phonème Basé sur un Nouveau Jeu de Données de Benchmark Ouvert pour le Chinois Mandarine

La conversion des graphèmes en phonèmes du chinois (G2P) est un élément essentiel des systèmes de synthèse vocale du mandarin (TTS). L'un des plus grands défis de la conversion G2P en chinois réside dans la désambiguïsation de la prononciation des polyphones, c'est-à-dire des caractères ayant plusieurs prononciations. Bien que de nombreux efforts académiques aient été déployés pour y remédier, il n'existe à ce jour aucun jeu de données ouvert qui puisse servir de référence standard pour une comparaison équitable. De plus, la plupart des systèmes rapportés sont difficiles à utiliser pour les chercheurs ou les praticiens souhaitant convertir le texte chinois en pinyin selon leurs besoins. Guidés par ces constatations, nous présentons dans cette étude un nouveau jeu de données de référence composé de plus de 99 000 phrases pour la désambiguïsation des polyphones chinois. Nous entraînons un modèle neuronal simple sur ce jeu de données et constatons qu'il surpasses les autres systèmes G2P existants. Enfin, nous avons empaqueté notre projet et nous le partageons sur PyPi.