Un Nouveau Modèle de Réseau Neuronal pour l'Étiquetage Morpho-syntactique et l'Analyse de Dépendance Basée sur un Graphe

Nous présentons un nouveau modèle de réseau neuronal qui apprend l'étiquetage morphosyntaxique (POS tagging) et l'analyse dépendancielle basée sur les graphes de manière conjointe. Notre modèle utilise des LSTM bidirectionnels pour apprendre des représentations de caractéristiques partagées entre les tâches d'étiquetage morphosyntaxique et d'analyse dépendancielle, ce qui permet de résoudre le problème d'ingénierie des caractéristiques. Nos expériences approfondies, menées sur 19 langues issues du projet Universal Dependencies, montrent que notre modèle surpassent le modèle à propagation par pile (Stack-propagation) basé sur les réseaux neuronaux actuellement considéré comme l'état de l'art pour l'étiquetage morphosyntaxique conjoint et l'analyse dépendancielle basée sur les transitions, établissant ainsi un nouveau standard. Notre code est open-source et disponible avec des modèles pré-entraînés à l'adresse suivante : https://github.com/datquocnguyen/jPTDP