DREEAM: Aufmerksamkeit durch Beweise leiten, um die extraktionsbasierte Relationserkennung auf Dokumentebene zu verbessern

Dokumentweite Relationsextraktion (DocRE) ist die Aufgabe, alle Relationen zwischen jeweils Paaren von Entitäten innerhalb eines Dokuments zu identifizieren. Beweise – definiert als Sätze, die Hinweise auf die Beziehung zwischen einem Entitätenpaar enthalten – haben sich als hilfreich erwiesen, da sie DocRE-Systeme dazu anleiten, sich auf relevante Textstellen zu konzentrieren und somit die Relationsextraktion zu verbessern. Allerdings stehen Beweisretrieval- (ER-)Verfahren in der DocRE vor zwei Hauptproblemen: hoher Speicherverbrauch und begrenzte Verfügbarkeit von Annotationen. Ziel dieser Arbeit ist es, diese Herausforderungen anzugehen, um die Nutzung von ER in der DocRE zu verbessern. Erstens stellen wir DREEAM vor, einen speichereffizienten Ansatz, der Beweisinformationen als überwachenden Signal nutzt, um die Aufmerksamkeitsmodule des DocRE-Systems dazu zu führen, hohe Gewichte auf Beweissätze zu setzen. Zweitens schlagen wir eine Selbsttraining-Strategie für DREEAM vor, die es ermöglicht, ER aus automatisch generierten Beweisen auf großem Datensatz ohne annotierte Beweise zu lernen. Experimentelle Ergebnisse zeigen, dass unser Ansatz sowohl für DocRE als auch für ER auf dem DocRED-Benchmark eine state-of-the-art-Leistung erzielt. Soweit uns bekannt ist, ist DREEAM der erste Ansatz, der ER-Selbsttraining einsetzt.