HyperAIHyperAI
il y a 2 mois

Un modèle amélioré de réseau neuronal pour l'étiquetage morphosyntaxique et l'analyse de dépendance conjoints

Dat Quoc Nguyen; Karin Verspoor
Un modèle amélioré de réseau neuronal pour l'étiquetage morphosyntaxique et l'analyse de dépendance conjoints
Résumé

Nous proposons un nouveau modèle de réseau neuronal pour l'étiquetage morphosyntaxique (POS) conjoint et l'analyse de dépendance. Notre modèle étend le célèbre analyseur de dépendance basé sur les graphes BIST (Kiperwasser et Goldberg, 2016) en intégrant une composante d'étiquetage basée sur le BiLSTM pour générer automatiquement des étiquettes POS pour l'analyseur. Sur la base de référence du Penn Treebank anglais, notre modèle obtient des scores UAS et LAS solides de 94,51 % et 92,87 % respectivement, améliorant les performances du parseur BIST basé sur les graphes de plus de 1,5 % en valeur absolue, tout en atteignant une précision d'étiquetage POS à l'état de l'art de 97,97 %. De plus, les résultats expérimentaux obtenus sur l'analyse de 61 grands treebanks des Dépendances Universelles à partir de textes bruts montrent que notre modèle surpassent la ligne de base UDPipe (Straka et Straková, 2017) avec un score moyen d'étiquetage POS supérieur de 0,8 % et un score moyen LAS supérieur de 3,6 %. En outre, notre modèle permet également d'obtenir des scores à l'état de l'art pour les tâches aval telles que l'extraction d'événements biomédicaux et l'analyse d'opinions. Notre code est disponible avec tous les modèles pré-entraînés sur : https://github.com/datquocnguyen/jPTDP

Un modèle amélioré de réseau neuronal pour l'étiquetage morphosyntaxique et l'analyse de dépendance conjoints | Articles de recherche récents | HyperAI