SAIS: Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction

Von der Satzebene zur Dokumentebene hin stellt die Forschung zum Relationsextraktionsverfahren (RE) zunehmend längere Texte und komplexere Entitäteninteraktionen gegenüber. Dadurch wird die Kodierung der entscheidenden Informationsquellen – relevanter Kontexte und Entitätstypen – noch herausfordernder. Bisherige Methoden lernen diese kritischen Informationsquellen jedoch nur implizit während des Trainings für RE. Folglich leiden sie unter ineffektiver Supervision und uninterpretierbaren Modellvorhersagen. Im Gegensatz dazu schlagen wir vor, das Modell explizit zu lehren, relevante Kontexte und Entitätstypen zu erfassen, indem wir mittels Supervision und Erweiterung intermediärer Schritte (SAIS) für RE vorgehen. Auf Basis eines breiten Spektrums sorgfältig entworfener Aufgaben ermöglicht unsere vorgeschlagene SAIS-Methode nicht nur eine qualitativ bessere Relationsextraktion durch effektivere Supervision, sondern auch eine präzisere Retrieval-Unterstützung durch entsprechende Belege, was die Interpretierbarkeit erhöht. Durch die Bewertung der Modellunsicherheit steigert SAIS zudem die Leistung mittels evidenzbasierter Datenvervollständigung und Ensemble-Inferenz, während gleichzeitig die Rechenkosten reduziert werden. Schließlich erzielt SAIS state-of-the-art-Ergebnisse bei drei Benchmarks (DocRED, CDR und GDA) und übertrifft den zweitbesten Ansatz bei der Belegretrieval auf DocRED um 5,04 % relativ in der F1-Score-Metrik.