Gemeinsame Extraktion von Entitäten und Relationen basierend auf einer neuen Zerlegungsstrategie

Die gemeinsame Extraktion von Entitäten und Relationen zielt darauf ab, Entitätenpaare zusammen mit ihren zugehörigen Relationen mit einem einzigen Modell zu erkennen. Vorangegangene Ansätze lösen diese Aufgabe typischerweise im Extract-then-Classify- oder im unified labeling-Ansatz. Diese Methoden leiden jedoch entweder unter überflüssigen Entitätenpaaren oder vernachlässigen die wichtige innere Struktur während des Extraktionsprozesses von Entitäten und Relationen. Um diese Einschränkungen zu überwinden, dekomponieren wir in diesem Artikel die gemeinsame Extraktionsaufgabe zunächst in zwei miteinander verknüpfte Teilprobleme: die HE-Extraktion (Head-Entity-Extraktion) und die TER-Extraktion (Tail-Entity-Relation-Extraktion). Das erste Teilproblem dient dazu, alle möglicherweise an einer Zielrelation beteiligten Kopfentitäten zu identifizieren, während das zweite Teilproblem darauf abzielt, für jede extrahierte Kopfentität die entsprechenden Endentitäten und Relationen zu bestimmen. Diese beiden Teilprobleme werden anschließend unter Verwendung unseres vorgeschlagenen span-basierten Tagging-Schemas weiter in mehrere Sequenzmarkierungsprobleme zerlegt, die effizient durch einen hierarchischen Boundary-Tagger und einen Multi-Span-Decoder gelöst werden können. Durch die sinnvolle Dekompositionstrategie kann unser Modell die semantische Wechselwirkung zwischen den einzelnen Schritten vollständig erfassen und gleichzeitig Rauschen durch irrelevanten Entitätenpaare reduzieren. Experimentelle Ergebnisse zeigen, dass unsere Methode gegenüber früheren Ansätzen um 5,2 %, 5,9 % und 21,5 % (F1-Score) übertrifft und somit eine neue state-of-the-art-Leistung auf drei öffentlichen Datensätzen erzielt.