HyperAIHyperAI
vor 3 Monaten

Eider: Dokumentenweite Relationsextraktion durch effiziente Beweisextraktion und Fusionsstrategien im Inferenzstadium

Yiqing Xie, Jiaming Shen, Sha Li, Yuning Mao, Jiawei Han
Eider: Dokumentenweite Relationsextraktion durch effiziente Beweisextraktion und Fusionsstrategien im Inferenzstadium
Abstract

Dokumentweite Relationsextraktion (DocRE) zielt darauf ab, semantische Relationen zwischen Entitätspaaren innerhalb eines Dokuments zu extrahieren. Typische DocRE-Methoden verarbeiten blind den gesamten Dokumenttext als Eingabe, während für Menschen oft bereits eine Teilmenge der Sätze im Dokument – die sogenannten Beweise (evidence) – ausreicht, um die Relation eines Entitätspaares zu erkennen. In diesem Paper stellen wir einen beweisverstärkten Rahmenwerk, Eider, vor, der die DocRE durch eine effiziente Extraktion von Beweisen und eine effektive Fusion der extrahierten Beweise im Inferenzprozess verbessert. Zunächst trainieren wir gemeinsam ein RE-Modell mit einem leichtgewichtigen Beweisextraktionsmodell, das sowohl im Speicherverbrauch als auch in der Laufzeit effizient ist. Empirisch zeigt sich, dass selbst die Ausbildung des Beweismodells auf Silberlabels, die durch unsere heuristischen Regeln generiert wurden, zu einer Verbesserung der RE-Leistung führen kann. Darüber hinaus entwerfen wir einen einfachen, aber effektiven Inferenzprozess, der RE-Vorhersagen sowohl auf den extrahierten Beweisen als auch auf dem vollständigen Dokument durchführt und die Vorhersagen schließlich durch eine Mischschicht (blending layer) fusioniert. Dadurch kann Eider sich auf relevante Sätze konzentrieren, während dennoch der Zugriff auf die gesamte Information im Dokument gewahrt bleibt. Umfangreiche Experimente zeigen, dass Eider state-of-the-art-Methoden auf drei Benchmark-Datensätzen übertrifft (z. B. um 1,37/1,26 Ign F1/F1 auf DocRED).

Eider: Dokumentenweite Relationsextraktion durch effiziente Beweisextraktion und Fusionsstrategien im Inferenzstadium | Forschungsarbeiten | HyperAI