Ein wörterbuchbasiertes Graph Neural Network für die chinesische NER

Rekurrente neuronale Netzwerke (RNN), die zur Erkennung benannter Entitäten (NER) im Chinesischen eingesetzt werden und charakter- und wortweises Informationsfluss sequenziell verfolgen, haben große Erfolge erzielt. Allerdings sind RNN-basierte Modelle aufgrund ihrer kettenförmigen Struktur und des Fehlens globaler Semantik anfällig für Wortambiguitäten. In dieser Arbeit versuchen wir, dieses Problem zu mildern, indem wir einen lexikonbasierten Graphen-neuronalen Netzwerkansatz mit globaler Semantik einführen. Dabei wird lexikalische Wissensbasis genutzt, um Zeichen miteinander zu verbinden, um lokale Wortzusammensetzungen zu erfassen, während ein globaler Relaisknoten die globale Satzsemantik und langreichweitige Abhängigkeiten erfassen kann. Aufgrund der mehrfachen graphenbasierten Interaktionen zwischen Zeichen, möglichen Wörtern und der Gesamtsatzsemantik können Wortambiguitäten effektiv bewältigt werden. Experimente an vier NER-Datensätzen zeigen, dass das vorgeschlagene Modell gegenüber anderen Baseline-Modellen signifikante Verbesserungen erzielt.