Command Palette
Search for a command to run...
Analyse constituante fortement incrémentale à l’aide de réseaux neuronaux graphiques
Analyse constituante fortement incrémentale à l’aide de réseaux neuronaux graphiques
Kaiyu Yang Jia Deng
Résumé
L’analyse des phrases en arbres syntaxiques peut apporter des bénéfices aux applications ultérieures en traitement automatique du langage naturel (NLP). Les parseurs basés sur les transitions construisent des arbres en exécutant des actions au sein d’un système de transition d’états. Ils sont efficaces sur le plan computationnel et peuvent exploiter l’apprentissage automatique pour prédire les actions à partir d’arbres partiels. Toutefois, les parseurs basés sur les transitions existants reposent principalement sur le système de transition décalage-réduction, qui ne correspond pas à la manière dont on sait que les humains analysent les phrases. Des recherches en psycholinguistique suggèrent que l’analyse humaine est fortement incrémentale : les humains construisent un seul arbre d’analyse en ajoutant exactement un token à chaque étape. Dans cet article, nous proposons un nouveau système de transition appelé attach-juxtapose. Ce système est fortement incrémental : il représente une phrase partielle à l’aide d’un seul arbre ; chaque action ajoute exactement un token à l’arbre partiel. À partir de ce système de transition, nous développons un parseur fortement incrémental. À chaque étape, il encode l’arbre partiel à l’aide d’un réseau neuronal de graphe et prédit une action. Nous évaluons notre parseur sur Penn Treebank (PTB) et Chinese Treebank (CTB). Sur PTB, il surpasser les parseurs existants entraînés uniquement à partir d’arbres constituants ; et il atteint des performances comparables aux meilleurs parseurs actuels qui utilisent des arbres de dépendance comme données d’entraînement supplémentaires. Sur CTB, notre parseur établit un nouveau record d’état de l’art. Le code est disponible à l’adresse suivante : https://github.com/princeton-vl/attach-juxtapose-parser.