HyperAIHyperAI
vor 2 Monaten

End-to-End-Sequenzmarkierung durch bidirektionale LSTM-CNNs-CRF

Xuezhe Ma; Eduard Hovy
End-to-End-Sequenzmarkierung durch bidirektionale LSTM-CNNs-CRF
Abstract

Zustandsderkunst-Systeme für Sequenzmarkierung erfordern traditionell große Mengen an aufgabenspezifischem Wissen in Form von manuell erstellten Merkmalen und Datenvorverarbeitung. In dieser Arbeit stellen wir eine neuartige Neuronenarchitektur vor, die durch die automatische Nutzung sowohl wort- als auch zeichengestufter Darstellungen profitiert, indem sie eine Kombination aus bidirektionalen LSTMs, CNNs und CRFs verwendet. Unser System ist wirklich von Anfang bis Ende konzipiert, benötigt keine Merkmalskonstruktion oder Datenvorverarbeitung und ist daher auf eine breite Palette von Sequenzmarkierungsaufgaben anwendbar. Wir evaluieren unser System anhand zweier Datensätze für zwei Sequenzmarkierungsaufgaben – dem Penn Treebank WSJ-Korpus für die Teil-of-Speech-Bestimmung (POS-Taggung) und dem CoNLL 2003-Korpus für die Erkennung benannter Entitäten (NER). Wir erzielen den aktuellen Stand der Technik in beiden Datensätzen – 97,55 % Genauigkeit bei der POS-Taggung und 91,21 % F1-Score bei der NER.

End-to-End-Sequenzmarkierung durch bidirektionale LSTM-CNNs-CRF | Neueste Forschungsarbeiten | HyperAI