HyperAIHyperAI
vor 11 Tagen

Gegnerische Transfer-Lernverfahren für die Erkennung chinesischer Named Entities mit Selbst-Attention-Mechanismus

{Yubo Chen, Pengfei Cao, Jun Zhao, Shengping Liu, Kang Liu}
Gegnerische Transfer-Lernverfahren für die Erkennung chinesischer Named Entities mit Selbst-Attention-Mechanismus
Abstract

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist eine zentrale Aufgabe im Bereich der natürlichen Sprachverarbeitung, bei der die Grenzen von Entitäten bestimmt und diese in vordefinierte Kategorien klassifiziert werden müssen. Bei der chinesischen NER-Aufgabe steht nur eine sehr geringe Menge an annotierten Daten zur Verfügung. Die chinesische NER-Aufgabe und die chinesische Wortsegmentierung (Chinese Word Segmentation, CWS) weisen viele gemeinsame Wortgrenzen auf, besitzen jedoch auch jeweils spezifische Eigenschaften. Bisherige Ansätze zur chinesischen NER nutzen entweder keine Informationen über Wortgrenzen aus der CWS oder können die spezifischen Merkmale der CWS nicht effektiv filtern. In diesem Artikel stellen wir einen neuartigen adversarialen Transfer-Lernrahmen vor, der die gemeinsam genutzten Informationsstrukturen der Wortgrenzen optimal nutzt und gleichzeitig die aufgaben-spezifischen Merkmale der CWS unterdrückt. Darüber hinaus berücksichtigen wir, dass beliebige Zeichen bei der Vorhersage der Entitätsart wichtige Hinweise liefern können, und nutzen daher selbst-Attention, um explizit langreichweitige Abhängigkeiten zwischen zwei Tokens zu erfassen. Experimentelle Ergebnisse auf zwei unterschiedlichen, weit verbreiteten Datensätzen zeigen, dass das vorgeschlagene Modell sowohl signifikant als auch konsistent gegenüber anderen state-of-the-art-Methoden übertrifft.

Gegnerische Transfer-Lernverfahren für die Erkennung chinesischer Named Entities mit Selbst-Attention-Mechanismus | Neueste Forschungsarbeiten | HyperAI