Fein-zu-Roh-Entitätendarstellungen für die Dokumentebene-Relationsextraktion

Die Dokumentebene-Relationsextraktion (Document-level Relation Extraction, RE) erfordert die Extraktion von Relationen, die innerhalb und über Sätze hinweg ausgedrückt werden. Neuere Arbeiten zeigen, dass graphbasierte Ansätze, die in der Regel einen dokumentenbasierten Graphen aufbauen, um dokumentenbewusste Wechselwirkungen zu erfassen, nützliche Entitätsdarstellungen liefern können, was der Bewältigung der Dokumentebene-RE hilft. Diese Methoden konzentrieren sich entweder stärker auf den gesamten Graphen oder legen mehr Wert auf einen Teil des Graphen, beispielsweise auf Pfade zwischen dem Zielentitätenpaar. Wir stellen jedoch fest, dass die Dokumentebene-RE von einer gleichzeitigen Berücksichtigung beider Aspekte profitieren könnte. Um daher umfassendere Entitätsdarstellungen zu erzielen, schlagen wir das Coarse-to-Fine Entity Representation-Modell (CFER) vor, das eine grob-zu-fein-Strategie mit zwei Phasen verfolgt. Zunächst nutzt CFER Graphneuronale Netze, um auf grober Ebene globale Informationen aus dem gesamten Graphen zu integrieren. Anschließend verwendet CFER diese globalen Informationen als Leitfaden, um auf feiner Ebene selektiv Pfainformationen zwischen dem Zielentitätenpaar zu aggregieren. Bei der Klassifikation kombinieren wir die Entitätsdarstellungen aus beiden Ebenen zu umfassenderen Darstellungen für die Relationsextraktion. Experimentelle Ergebnisse auf zwei Dokumentebene-RE-Datensätzen, DocRED und CDR, zeigen, dass CFER bestehende Modelle übertrifft und robust gegenüber einer ungleichmäßigen Labelverteilung ist.