HyperAIHyperAI
vor 17 Tagen

Schlussfolgern mit latenter Strukturverfeinerung für die Dokumentebene-Relationsextraktion

Guoshun Nan, Zhijiang Guo, Ivan Sekulić, Wei Lu
Schlussfolgern mit latenter Strukturverfeinerung für die Dokumentebene-Relationsextraktion
Abstract

Die extraktion von Beziehungen auf Dokumentebene erfordert die Integration von Informationen innerhalb und über mehrere Sätze eines Dokuments hinweg sowie die Erfassung komplexer Wechselwirkungen zwischen entitäten über Sätze hinweg. Die effektive Aggregation relevanter Informationen im Dokument bleibt jedoch eine herausfordernde Forschungsaufgabe. Bestehende Ansätze konstruieren statische, auf Dokumentebene basierende Graphen auf Grundlage syntaktischer Bäume, Coreferenzen oder Heuristiken aus unstrukturiertem Text, um Abhängigkeiten zu modellieren. Im Gegensatz zu früheren Methoden, die möglicherweise reichhaltige nicht-lokale Wechselwirkungen für die Inferenz nicht erfassen können, schlagen wir ein neuartiges Modell vor, das die relationale Schlussfolgerung über Sätze hinweg durch die automatische Induktion eines latenten, dokumentweiten Graphen ermöglicht. Darüber hinaus entwickeln wir eine Verfeinerungsstrategie, die es dem Modell erlaubt, schrittweise relevante Informationen für multi-hop-Reasoning zu aggregieren. Konkret erreicht unser Modell auf einem großskaligen Dokumentebenen-Datensatz (DocRED) einen F1-Score von 59,05, was eine signifikante Verbesserung gegenüber früheren Ergebnissen darstellt, und erzielt zudem neue SOTA-Ergebnisse auf den Datensätzen CDR und GDA. Zudem zeigen umfassende Analysen, dass das Modell in der Lage ist, genauere Beziehungen zwischen Sätzen zu erkennen.