Ein relationsspezifisches Aufmerksamkeitsnetzwerk für die gemeinsame Entität- und Relationsextraktion

Die gemeinsame Extraktion von Entitäten und Relationen ist eine zentrale Aufgabe im Bereich der natürlichen Sprachverarbeitung (NLP), die darauf abzielt, alle relationalen Tripel aus unstrukturierten Texten zu identifizieren. Dies stellt eine erhebliche Herausforderung dar, da einige aus einem Satz extrahierte Tripel überlappende Entitäten aufweisen können. Die meisten bestehenden Ansätze führen zunächst die Entitätenextraktion durch und anschließend die Relationserkennung für alle möglichen Paare von Entitäten, was typischerweise zu einer großen Anzahl redundanter Berechnungen führt. In diesem Paper stellen wir ein relationsspezifisches Aufmerksamkeitsnetzwerk (Relation-Specific Attention Network, RSAN) vor, um dieses Problem zu bewältigen. Unser RSAN nutzt eine relationssensible Aufmerksamkeitsmechanik, um für jede Relation spezifische Satzrepräsentationen zu generieren, und führt anschließend eine Sequenzmarkierung durch, um die entsprechenden Kopf- und Tail-Entitäten zu extrahieren. Experimente auf zwei öffentlichen Datensätzen zeigen, dass unser Modell überlappende Tripel effektiv extrahieren kann und eine state-of-the-art Leistung erzielt. Der Quellcode ist unter https://github.com/Anery/RSAN verfügbar.