Dokumentenbasierte Ereignisextraktion durch ein heterogenes graphenbasiertes Interaktionsmodell mit einem Tracker

Die Dokumentebene-Ereignisextraktion zielt darauf ab, Ereignisinformationen aus einem gesamten Artikel zu erkennen. Bestehende Methoden sind aufgrund zweier Herausforderungen dieser Aufgabe nicht effektiv: a) die Zielereignisargumente sind über mehrere Sätze verteilt; b) die Korrelation zwischen Ereignissen in einem Dokument ist schwierig zu modellieren. In diesem Papier schlagen wir ein heterogenes Graphenbasiertes Interaktionsmodell mit einem Tracker (GIT) vor, um die genannten beiden Herausforderungen zu bewältigen. Für die erste Herausforderung konstruiert GIT ein heterogenes Grapheninteraktionsnetzwerk, um globale Interaktionen zwischen verschiedenen Sätzen und Entitätsnennungen zu erfassen. Für die zweite Herausforderung führt GIT einen Tracker-Modul ein, um die extrahierten Ereignisse zu verfolgen und somit ihre gegenseitige Abhängigkeit zu erfassen. Experimente auf einem großen Datensatz (Zheng et al., 2019) zeigen, dass GIT die bisherigen Methoden um 2,8 F1 übertreffen kann. Eine weitere Analyse ergibt, dass GIT effektiv bei der Extraktion mehrerer korrelierter Ereignisse und Ereignisargumente ist, die im Dokument verteilt sind. Unser Code ist unter https://github.com/RunxinXu/GIT verfügbar.