BoningKnife: Gemeinsame Erkennung und Klassifizierung von Entitätsmentionen für verschachteltes NER durch vorheriges Randwissen

Während die Erkennung benannter Entitäten (Named Entity Recognition, NER) eine zentrale Aufgabe in der Verarbeitung natürlicher Sprache darstellt, richten sich die meisten Ansätze nur auf flache Entitäten und ignorieren geschachtelte Strukturen, die in vielen Szenarien häufig vorkommen. Die meisten existierenden Methoden zur geschachtelten NER durchlaufen alle Untersequenzen, was sowohl kostspielig als auch ineffizient ist und zudem das wichtige Randwissen für geschachtelte Entitäten nicht ausreichend berücksichtigt. In dieser Arbeit schlagen wir ein gemeinsames Modell zur Erkennung und Klassifizierung von Entitätserwähnungen mittels vorherigen Randwissens (BoningKnife) vor, um die Extraktion und Erkennung von geschachtelten NER-Aufgaben besser zu bewältigen. BoningKnife besteht aus zwei Modulen: MentionTagger und TypeClassifier. MentionTagger nutzt das Randwissen über den Beginn und das Ende der Entitäten hinaus besser aus, um das Handling von Schachtelniveaus und längeren Spannen zu verbessern sowie hochwertige Kandidaten für Erwähnungen zu generieren. TypeClassifier verwendet ein zweistufiges Aufmerksamkeitsmechanismus, um verschiedene Darstellungen auf unterschiedlichen Schachtelniveaus zu entkoppeln und Entitätstypen besser zu unterscheiden. Beide Module werden gemeinsam trainiert, wobei sie eine gemeinsame Darstellung teilen und eine neue Doppel-Info-Aufmerksamkeitsschicht verwenden, was zu einer verbesserten Fokussierung auf entitätsbezogene Informationen führt. Experimente mit verschiedenen Datensätzen zeigen, dass unser Ansatz die bisher besten Methoden übertrifft und F1-Werte von 86,41, 85,46 und 94,2 auf ACE2004, ACE2005 und NNE erreicht.