SagDRE: Sequence-Aware Graph-basierte extraktion von Beziehungen auf Dokumentenebene mit adaptivem Margin-Loss

Die Relationsextraktion (RE) ist eine zentrale Aufgabe für zahlreiche Anwendungen im Bereich des natürlichen Sprachverstehens. Die Dokument-Level-Relationsextraktion zielt darauf ab, Relationen innerhalb eines Dokuments zu extrahieren und stellt dabei erhebliche Herausforderungen für die RE-Aufgaben dar, da sie Schlussfolgerungen über mehrere Sätze hinweg erfordert und die Behandlung mehrerer Relationen innerhalb desselben Dokuments ermöglichen muss. Bestehende state-of-the-art-Modelle für die Dokument-Level-RE nutzen strukturelle Graphen, um langstreckige Korrelationen besser zu erfassen. In dieser Arbeit stellen wir das SagDRE-Modell vor, das zudem die ursprüngliche sequenzielle Struktur des Textes berücksichtigt und erfasst. Das vorgeschlagene Modell lernt sinnhafte gerichtete Kanten auf Satzebene, um den Informationsfluss innerhalb des Dokuments zu erfassen, und nutzt die tokenbasierte sequenzielle Information, um den kürzesten Pfad zwischen zwei Entitäten zu kodieren. Zudem führen wir eine adaptive Margin-Loss-Funktion ein, die darauf abzielt, die Abstände zwischen positiven und negativen Klassen zu maximieren. Die experimentellen Ergebnisse auf Datensätzen verschiedener Domänen belegen die Wirksamkeit der vorgeschlagenen Methoden.