HyperAIHyperAI
vor 17 Tagen

Ein tiefes neuronales Netzwerkmodell für die Aufgabe der benannten Entitätserkennung

{Anh Le. Mikhail S. Burtsev}
Ein tiefes neuronales Netzwerkmodell für die Aufgabe der benannten Entitätserkennung
Abstract

Ein entscheidender Faktor, der die Qualität der neuronalen Sequenzmarkierung direkt und signifikant beeinflusst, ist die Auswahl und Kodierung der Eingabemerkmale zur Generierung reichhaltiger semantischer und grammatischer Repräsentationsvektoren. In diesem Artikel stellen wir ein tiefes neuronales Netzwerkmodell vor, das ein spezifisches Problem der Sequenzmarkierung, nämlich die Erkennung benannter Entitäten (Named Entity Recognition, NER), adressiert. Das Modell besteht aus drei Teilnetzwerken, die darauf abzielen, Charakterebene- und Großschreibungseigenschaften sowie kontextuelle Wortrepräsentationen auf der Wortebene umfassend auszunutzen. Um die Fähigkeit unseres Modells zur Generalisierung auf verschiedene Sprachen zu demonstrieren, haben wir es anhand von Russisch, Vietnamesisch, Englisch und Chinesisch evaluiert und dabei jeweils Spitzenleistungen erzielt: F-Maß-Werte von 91,10 %, 94,43 %, 91,22 % und 92,95 % auf den Datensätzen Gareev, VLSP-2016, CoNLL-2003 und MSRA. Darüber hinaus erreicht unser Modell auch bei Verwendung lediglich von 100 Trainings- und Validierungsbeispielen eine gute Leistung (etwa 70 % F1).