Effiziente Dokumentebene-Ereignisextraktion durch Pseudo-Trigger-bewusste gekürzte vollständige Graphen

Die meisten bisherigen Studien zur Dokumentebene-Ereignisextraktion konzentrieren sich hauptsächlich auf die Erstellung von Argumentketten in einer autoregressiven Weise, was zwar einen gewissen Erfolg erzielt, aber sowohl im Training als auch bei der Inferenz ineffizient ist. Im Gegensatz zu den vorherigen Studien schlagen wir ein schnelles und leichtgewichtiges Modell namens PTPCG vor. In unserem Modell entwickeln wir eine neuartige Strategie für die Kombination von Ereignisargumenten zusammen mit einem nicht-autoregressiven Decodieralgorithmus über gestutzte vollständige Graphen, die unter der Anleitung automatisch ausgewählter Pseudotrigger erstellt werden. Verglichen mit den früheren Systemen erreicht unser System vergleichbare Ergebnisse mit nur 19,8 % der Parameter und einem deutlich geringeren Ressourcenverbrauch, wobei es nur 3,8 % der GPU-Stunden für das Training benötigt und bis zu 8,5-mal schneller bei der Inferenz ist. Darüber hinaus zeigt unser Modell eine überlegene Kompatibilität für Datensätze mit (oder ohne) Trigger, und die Pseudotrigger können als Ergänzung zu annotierten Triggern dienen, um weitere Verbesserungen zu erzielen. Der Quellcode ist unter https://github.com/Spico197/DocEE verfügbar.