Prédiction de la prominence prosodique à partir du texte avec des représentations de mots contextuelles pré-entraînées

Dans cet article, nous présentons un nouveau jeu de données et un benchmark en traitement automatique des langues naturelles pour la prédiction de la prominence prosodique à partir de texte écrit. Selon nos connaissances, il s'agira du plus grand jeu de données publiquement disponible comportant des annotations prosodiques. Nous décrivons en détail la construction du jeu de données ainsi que le benchmark résultant, et nous entraînons plusieurs modèles allant des classifieurs basés sur les caractéristiques aux systèmes de réseaux neuronaux pour la prédiction de la prominence prosodique discrétisée. Nous montrons que les représentations contextuelles pré-entraînées de mots issues de BERT surpassent les autres modèles même avec moins de 10 % des données d'entraînement. Enfin, nous discutons du jeu de données à la lumière des résultats et indiquons les pistes de recherche futures ainsi que les plans pour améliorer davantage à la fois le jeu de données et les méthodes de prédiction de la prominence prosodique à partir du texte. Le jeu de données et le code des modèles sont disponibles au public.