HyperAIHyperAI

Command Palette

Search for a command to run...

Multilinguale Part-of-Speech-Tagging mit bidirektionalen Long-Short-Term-Memory-Modellen und Hilfsverlustfunktion

Barbara Plank Anders Søgaard Yoav Goldberg

Zusammenfassung

Bidirektionale Long Short-Term Memory (bi-LSTM)-Netzwerke haben sich kürzlich bei verschiedenen NLP-Sequenzmodellierungsaufgaben als erfolgreich erwiesen, jedoch ist wenig bekannt über ihre Abhängigkeit von Eingaberepräsentationen, Zielsprachen, Datensatzgrößen und Etikettenrauschen. In dieser Arbeit untersuchen wir diese Aspekte und evaluieren bi-LSTMs mit Wort-, Zeichen- und Unicode-Byte-Embeddings für die Part-of-Speech-Tagging (POS-Tagging). Wir vergleichen bi-LSTMs mit traditionellen POS-Tagsystemen in verschiedenen Sprachen und bei unterschiedlichen Datenmengen. Darüber hinaus stellen wir ein neues bi-LSTM-Modell vor, das die POS-Tagging-Fehlerfunktion mit einer zusätzlichen Fehlerfunktion kombiniert, die selten vorkommende Wörter berücksichtigt. Das Modell erzielt den aktuellen Stand der Technik in 22 Sprachen und funktioniert besonders gut für morphologisch komplexe Sprachen. Unsere Analyse deutet darauf hin, dass bi-LSTMs weniger empfindlich gegenüber der Größe des Trainingsdatensatzes und Etikettenverfälschungen (bei geringen Rauschpegeln) sind als bisher angenommen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Multilinguale Part-of-Speech-Tagging mit bidirektionalen Long-Short-Term-Memory-Modellen und Hilfsverlustfunktion | Paper | HyperAI