HyperAIHyperAI
vor 2 Monaten

VaeDiff-DocRE: Ein umfassendes Datenverstärkungsframework für die Beziehungsextraktion auf Dokumentenebene

Khai Phan Tran; Wen Hua; Xue Li
VaeDiff-DocRE: Ein umfassendes Datenverstärkungsframework für die Beziehungsextraktion auf Dokumentenebene
Abstract

Dokumentbezogene Relationsextraktion (DocRE) hat das Ziel, Beziehungen zwischen Entitätspaaren innerhalb eines Dokuments zu identifizieren. Die meisten existierenden Methoden gehen jedoch davon aus, dass die Klassenverteilung gleichmäßig ist, was zu suboptimaler Leistung auf realen, unbalancierten Datensätzen führt. Um dieser Herausforderung zu begegnen, schlagen wir einen neuen Ansatz zur Datenverstärkung vor, der generative Modelle verwendet, um Daten im Einbettungsraum zu erweitern. Unsere Methode nutzt die Architektur des variationellen Autoencoders (VAE), um alle beziehungsspezifischen Verteilungen, die durch die Darstellungen von Entitätspaaren gebildet werden, zu erfassen und Daten für unterrepräsentierte Beziehungen zu vergrößern. Um das mehrklassige Wesen der DocRE besser zu erfassen, parametrisieren wir den latenten Raum des VAE mit einem Diffusionsmodell. Zudem führen wir ein hierarchisches Trainingsframework ein, um das vorgeschlagene VAE-basierte Verstärkungsmodul in DocRE-Systeme zu integrieren. Experimente an zwei Benchmark-Datensätzen zeigen, dass unsere Methode den aktuellen Stand der Technik übertrifft und das Problem der langen Schweifeverteilung in der DocRE effektiv löst.

VaeDiff-DocRE: Ein umfassendes Datenverstärkungsframework für die Beziehungsextraktion auf Dokumentenebene | Neueste Forschungsarbeiten | HyperAI