HyperAIHyperAI
vor 18 Tagen

OpenIE6: Iterative Grid Labeling and Coordination Analysis for Open Information Extraction

Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti
OpenIE6: Iterative Grid Labeling and Coordination Analysis for Open Information Extraction
Abstract

Ein kürzlich vorgestelltes State-of-the-Art-Neuronales Open Information Extraction (OpenIE)-System generiert Extraktionen iterativ und erfordert hierbei wiederholte Kodierungen partieller Ausgaben, was mit erheblichen rechnerischen Kosten verbunden ist. Im Gegensatz dazu sind Sequenzmarkierungsansätze für OpenIE deutlich schneller, weisen jedoch eine geringere Extraktionsqualität auf. In diesem Paper schließen wir diese Kompromisslage durch die Einführung eines iterativen, auf Markierung basierenden Systems, das eine neue State-of-the-Art-Leistung für OpenIE erreicht und dabei 10-mal schneller extrahiert. Dies wird durch eine neuartige Architektur namens Iterative Grid Labeling (IGL) ermöglicht, die OpenIE als zweidimensionales Gitter-Markierungssproblem formuliert. Die Leistung dieser Architektur wird zusätzlich durch die Anwendung von Abdeckungs-(soft-)Beschränkungen auf dem Gitter während des Trainings weiter verbessert.Darüber hinaus beobachten wir, dass die besten OpenIE-Systeme Schwierigkeiten bei der Behandlung von Koordinationsstrukturen haben. Unser OpenIE-System integriert daher einen neuen Koordinationsanalysator, der ebenfalls auf der IGL-Architektur basiert. Dieser IGL-basierte Koordinationsanalysator ermöglicht es unserem OpenIE-System, komplexe Koordinationsstrukturen effektiv zu verarbeiten und gleichzeitig eine neue State-of-the-Art-Leistung auf dem Gebiet der Koordinationsanalyse zu erreichen – mit einer Verbesserung von 12,3 Punkten im F1-Score gegenüber vorherigen Analysatoren. Unser OpenIE-System, OpenIE6, erreicht eine F1-Verbesserung von bis zu 4 Punkten gegenüber früheren Systemen und ist dabei erheblich schneller.