Neuronales Metrik-Lernen für schnelles end-to-end Beziehungsextrahieren

Die Relationsextraktion (RE) ist eine unverzichtbare Informationsextraktionsaufgabe in mehreren Disziplinen. RE-Modelle gehen in der Regel davon aus, dass die Named Entity Recognition (NER) bereits in einem vorherigen Schritt durch ein anderes unabhängiges Modell durchgeführt wurde. Mehrere jüngste Ansätze im Bereich der end-to-end RE streben danach, Aufgabenkorrelationen zu nutzen, indem sowohl die NER als auch die RE-Aufgaben gemeinsam modelliert werden. Frühere Arbeiten in diesem Bereich reduzieren die Aufgabe häufig auf ein Tabellenfüllungsproblem, bei dem ein zusätzlicher teurer Decodierungsschritt mit Beam Search angewendet wird, um global konsistente Zellenlabels zu erhalten. In Ansätzen, die keine Tabellenfüllung verwenden, ist eine globale Optimierung in Form von CRFs mit Viterbi-Decodierung für den NER-Bestandteil immer noch erforderlich, um wettbewerbsfähige Ergebnisse zu erzielen. Wir stellen eine neuartige neuronale Architektur vor, die die Tabellenstruktur nutzt und auf wiederholten Anwendungen von 2D-Faltungen zur Pooling lokaler Abhängigkeiten und metrischer Merkmale basiert. Diese Architektur verbessert den Stand der Technik ohne Notwendigkeit einer globalen Optimierung. Wir validieren unser Modell anhand der Datensätze ADE und CoNLL04 für end-to-end RE und zeigen eine Verbesserung von etwa 1 % (in Bezug auf den F-Wert) gegenüber früheren besten Ergebnissen, wobei Trainings- und Testzeiten sieben bis zehn Mal schneller sind – letzteres ist für zeitkritische Endbenutzeranwendungen hochvorteilhaft.