HyperAIHyperAI
vor 2 Monaten

REXEL: Ein End-to-End-Modell für Dokumentebene-Relationsextraktion und Entitätensverlinkung

Nacime Bouziani; Shubhi Tyagi; Joseph Fisher; Jens Lehmann; Andrea Pierleoni
REXEL: Ein End-to-End-Modell für Dokumentebene-Relationsextraktion und Entitätensverlinkung
Abstract

Das Extrahieren strukturierter Informationen aus unstrukturiertem Text ist für viele nachgelagerte NLP-Anwendungen entscheidend und wird traditionell durch geschlossene Informationsextraktion (cIE) erreicht. Bestehende Ansätze für cIE leiden jedoch unter zwei Einschränkungen: (i) sie sind oft Pipelines, was sie anfällig für Fehlerfortpflanzung macht, und/oder (ii) sie sind auf Satzebene beschränkt, was es verhindert, langreichweitige Abhängigkeiten zu erfassen und zu teuren Inferenzzeiten führt. Wir beheben diese Einschränkungen durch den Vorschlag von REXEL, einem hoch effizienten und genauen Modell für die gemeinsame Aufgabe der Dokumentebenen-cIE (DocIE). REXEL führt in einem einzigen Vorwärtsdurchgang Erwähnungsidentifikation, Entitätstypisierung, Entitätsaufklärung, Coreferenzauflösung und dokumentspezifische Relationenklassifikation durch, um Fakten vollständig mit einem Referenzwissensgraphen zu verknüpfen. Im Durchschnitt ist es 11-mal schneller als vergleichbare bestehende Ansätze in einer ähnlichen Einstellung und zeigt wettbewerbsfähige Leistungen sowohl bei der Optimierung für eine der einzelnen Teilaufgaben als auch bei verschiedenen Kombinationen verschiedener gemeinsamer Aufgaben, wobei es die Baselines im Durchschnitt um mehr als 6 F1-Punkte übertrifft. Die Kombination von Geschwindigkeit und Genauigkeit macht REXEL ein präzises und kosteneffizientes System zur Extraktion strukturierter Informationen im Webmaßstab. Zudem veröffentlichen wir eine Erweiterung des DocRED-Datensatzes, um Benchmarks für zukünftige Arbeiten zur DocIE zu ermöglichen. Diese ist unter https://github.com/amazon-science/e2e-docie verfügbar.

REXEL: Ein End-to-End-Modell für Dokumentebene-Relationsextraktion und Entitätensverlinkung | Neueste Forschungsarbeiten | HyperAI