Verbesserung der dokumentweiten Relationsextraktion durch Entity-Kenntnis-Injektion

Die Dokumentebene-Relationsextraktion (Document-level Relation Extraction, RE) zielt darauf ab, die Beziehungen zwischen Entitäten über den gesamten Umfang eines Dokuments hinweg zu identifizieren. Hierfür sind komplexe Schlussfolgerungsfähigkeiten erforderlich, um verschiedene Arten von Wissen – wie Coreferenzen und Alltagswissen – zu integrieren. Große Skalen-Wissensgraphen (Knowledge Graphs, KGs) enthalten eine Fülle an realweltlichen Fakten und können wertvolles Wissen für die Dokumentebene-RE bereitstellen. In diesem Paper stellen wir einen Framework zur Einbettung von Entitätenwissen vor, um aktuelle Dokumentebene-RE-Modelle zu verbessern. Konkret führen wir eine Coreferenz-Destillation ein, um Coreferenzwissen zu integrieren, wodurch das RE-Modell über eine allgemeinere Fähigkeit zur Coreferenzschlussfolgerung verfügt. Zudem nutzen wir eine Repräsentationsrekonstruktion, um faktisches Wissen einzubetten und KG-Repräsentationen sowie Dokument-Repräsentationen in einen einheitlichen Raum zu integrieren. Experimente auf zwei etablierten Benchmark-Datensätzen bestätigen die Generalisierbarkeit unseres Frameworks zur Einbettung von Entitätenwissen sowie die konsistente Verbesserung mehrerer Dokumentebene-RE-Modelle.