HyperAIHyperAI
vor 11 Tagen

Ein Sequenz-zu-Menge-Netzwerk für verschachtelte benannte Entitäts-Erkennung

Zeqi Tan, Yongliang Shen, Shuai Zhang, Weiming Lu, Yueting Zhuang
Ein Sequenz-zu-Menge-Netzwerk für verschachtelte benannte Entitäts-Erkennung
Abstract

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist eine weit verbreitete Aufgabe im Bereich der natürlichen Sprachverarbeitung. In jüngster Zeit rückt die Erkennung geschachtelter Entitäten (nested NER) zunehmend in den Fokus wissenschaftlicher Untersuchungen. Spannenbasierte Ansätze, die die Entitätsrekognition als Spannen-Klassifikationsaufgabe modellieren, können geschachtelte Entitäten natürlicherweise verarbeiten. Sie leiden jedoch unter einem enormen Suchraum und einem Mangel an Interaktionen zwischen den Entitäten. Um diese Probleme zu bewältigen, schlagen wir ein neuartiges sequenz-zu-Menge-Neuronales Netzwerk für die geschachtelte NER vor. Im Gegensatz zu herkömmlichen Ansätzen, bei denen Kandidatenspannen vorab festgelegt werden, verwenden wir eine feste Menge lernbarer Vektoren, um Muster wertvoller Spannen zu erlernen. Wir nutzen einen nicht-autoregressiven Decoder, um die endgültige Menge an Entitäten in einem einzigen Durchlauf vorherzusagen, wodurch wir Abhängigkeiten zwischen den Entitäten erfassen können. Im Vergleich zu sequenz-zu-sequenz-Methoden ist unser Modell besser geeignet für solche ungeordneten Erkennungsaufgaben, da es unempfindlich gegenüber der Reihenfolge der Labels ist. Zudem verwenden wir eine Verlustfunktion basierend auf bipartiten Zuordnungen, um den Gesamtverlust während des Trainings zu berechnen. Experimentelle Ergebnisse zeigen, dass unser vorgeschlagenes Modell auf drei gängigen Korpora für geschachtelte NER – ACE 2004, ACE 2005 und KBP 2017 – den Stand der Technik erreicht. Der Quellcode ist unter https://github.com/zqtan1024/sequence-to-set verfügbar.

Ein Sequenz-zu-Menge-Netzwerk für verschachtelte benannte Entitäts-Erkennung | Neueste Forschungsarbeiten | HyperAI