HyperAIHyperAI
vor 18 Tagen

Ein maskierter Bildrekonstruktionsnetzwerk für dokumentweite Relationsextraktion

Liang Zhang, Yidong Cheng
Ein maskierter Bildrekonstruktionsnetzwerk für dokumentweite Relationsextraktion
Abstract

Die Dokumentebene-Relationsextraktion zielt darauf ab, Beziehungen zwischen Entitäten innerhalb eines Dokuments zu extrahieren. Im Vergleich zu ihrer Satzebene-Entsprechung erfordert die Dokumentebene-Relationsextraktion die Inferenz über mehrere Sätze, um komplexe relationale Tripel zu identifizieren. Frühere Forschungsarbeiten führen die Schlussfolgerung normalerweise durch Informationsweiterleitung in Erwähnungs- oder Entitäts-Ebene-Dokument-Graphen durch, wobei jedoch die Korrelationen zwischen den Beziehungen unberücksichtigt bleiben. In diesem Paper stellen wir ein neuartiges Modell für die Dokumentebene-Relationsextraktion vor, basierend auf einem Masked Image Reconstruction-Netzwerk (DRE-MIR), das die Inferenz als Problem der maskierten Bildrekonstruktion modelliert, um die Korrelationen zwischen Beziehungen zu erfassen. Konkret nutzen wir zunächst ein Encoder-Modul, um Merkmale von Entitäten zu extrahieren und auf Basis dieser Merkmale eine Entitätenpaar-Matrix zu konstruieren. Anschließend betrachten wir diese Entitätenpaar-Matrix als Bild, maskieren sie zufällig und rekonstruieren sie mittels eines Inferenzmoduls, um die Korrelationen zwischen den Beziehungen zu erfassen. Wir evaluieren unser Modell auf drei öffentlichen Datensätzen für Dokumentebene-Relationsextraktion, nämlich DocRED, CDR und GDA. Experimentelle Ergebnisse zeigen, dass unser Modell auf diesen drei Datensätzen eine state-of-the-art Leistung erzielt und außerordentliche Robustheit gegenüber Rauschen während des Inferenzprozesses aufweist.