Extraction d’événements au niveau du document par un modèle d’interaction basé sur des graphes hétérogènes avec un tracker

L'extraction d'événements au niveau du document vise à reconnaître les informations sur les événements à partir d'un article complet. Les méthodes existantes ne sont pas efficaces en raison de deux défis de cette tâche : a) les arguments cibles des événements sont dispersés dans différentes phrases ; b) la corrélation entre les événements dans un document est complexe à modéliser. Dans cet article, nous proposons un modèle d'interaction basé sur un graphe hétérogène avec un module Tracker (GIT) pour résoudre ces deux défis mentionnés précédemment. Pour le premier défi, GIT construit un réseau d'interaction de graphe hétérogène afin de capturer les interactions globales entre différentes phrases et mentions d'entités. Pour le second, GIT introduit un module Tracker pour suivre les événements extraits et ainsi capturer l'interdépendance entre ces événements. Les expériences menées sur un jeu de données à grande échelle (Zheng et al., 2019) montrent que GIT surpassent les méthodes précédentes avec une amélioration de 2,8 points en F1. Une analyse supplémentaire révèle que GIT est efficace pour extraire plusieurs événements corrélés ainsi que leurs arguments qui sont dispersés dans le document. Notre code est disponible à l'adresse https://github.com/RunxinXu/GIT.