Text2Event: Steuerbare Sequenz-zu-Struktur-Generierung für end-to-end Ereignisextraktion

Die Ereignisextraktion ist aufgrund der komplexen Struktur von Ereignisprotokollen und der semantischen Lücke zwischen Text und Ereignis herausfordernd. Traditionelle Methoden extrahieren Ereignisprotokolle häufig, indem sie die komplexe Strukturvorhersageaufgabe in mehrere Teilprobleme zerlegen. In diesem Artikel stellen wir Text2Event vor, ein Paradigma der Sequenz-zu-Struktur-Generierung, das Ereignisse direkt aus Texten in einer end-to-end-Weise extrahieren kann. Konkret entwerfen wir ein Sequenz-zu-Struktur-Netzwerk für die einheitliche Ereignisextraktion, einen eingeschränkten Dekodierungsalgorithmus zur Einbindung von Ereignisknow-how während der Inferenz sowie einen Curriculum-Lernalgorithmus zur effizienten Modelltrainierung. Experimentelle Ergebnisse zeigen, dass unsere Methode durch die einheitliche Modellierung aller Aufgaben in einem einzigen Modell und die universelle Vorhersage verschiedener Etiketten eine konkurrenzfähige Leistung erzielt – und zwar sowohl in Supervised-Learning- als auch in Transfer-Learning-Szenarien – unter Verwendung lediglich von protokollbasierten Annotationen.