Extraktion relationaler Fakten durch ein end-to-end neuronales Modell mit Kopiermechanismus

Die relationalen Fakten in Sätzen sind oft komplex. Verschiedene relationale Tripletts können sich innerhalb eines Satzes überlappen. Wir gliederten die Sätze entsprechend dem Grad der Triplettoverlappung in drei Klassen ein: Normal, EntityPairOverlap und SingleEntityOverlap. Bestehende Methoden konzentrieren sich hauptsächlich auf die Klasse Normal und erreichen bei der präzisen Extraktion relationaler Triplettss nicht zufriedenstellende Ergebnisse. In diesem Artikel stellen wir ein end-to-end-Modell basierend auf Sequence-to-Sequence-Lernverfahren mit Copy-Mechanismus vor, das relationalen Fakten gleichzeitig aus Sätzen jeder dieser Klassen extrahieren kann. Wir verwenden im Dekodierungsprozess zwei unterschiedliche Strategien: entweder einen einzigen gemeinsamen Dekoder oder mehrere getrennte Dekoder. Wir testen unsere Modelle an zwei öffentlichen Datensätzen und zeigen, dass unser Modell die Basismethode signifikant übertrifft.