HyperAIHyperAI
vor 2 Monaten

Dokumentbasierte Entitätsorientierte Extraktion als Vorlagengenerierung

Kung-Hsiang Huang; Sam Tang; Nanyun Peng
Dokumentbasierte Entitätsorientierte Extraktion als Vorlagengenerierung
Abstract

Die dokumentenbasierte entitätszentrierte Extraktion (EE), die darauf abzielt, entitätsbezogene Informationen wie Entitätsrollen und Entitätsbeziehungen zu extrahieren, ist entscheidend für die automatische Wissensgewinnung aus Textkorpora in verschiedenen Bereichen. Die meisten dokumentenbasierten EE-Systeme erstellen extraktive Modelle, die Schwierigkeiten haben, langfristige Abhängigkeiten zwischen den Entitäten auf Dokumentenebene zu modellieren. Um dieses Problem zu lösen, schlagen wir einen generativen Rahmen für zwei dokumentenbasierte EE-Aufgaben vor: die Extraktion von Rollenfüllern (REE) und die Beziehungsextraktion (RE). Wir formulieren diese zunächst als ein Template-Generierungsproblem, was es den Modellen ermöglicht, effizient Quer-Entitätsabhängigkeiten zu erfassen, Label-Semantik auszunutzen und die exponentielle Rechenaufwandkomplexität bei der Identifikation von N-stelligen Beziehungen zu vermeiden. Ein neuartiges cross-attention-gesteuertes Kopiermechanismus, TopK Copy, wird in ein vorgefertigtes Sequenz-zu-Sequenz-Modell integriert, um dessen Fähigkeit zur Identifikation von Schlüsselinformationen im Eingabetext zu verbessern. Experimente mit dem MUC-4- und SciREX-Datensatz zeigen neue Stand der Technik-Ergebnisse bei REE (+3,26 %), binärer RE (+4,8 %) und 4-stelliger RE (+2,7 %) in Bezug auf den F1-Score.

Dokumentbasierte Entitätsorientierte Extraktion als Vorlagengenerierung | Neueste Forschungsarbeiten | HyperAI