HyperAIHyperAI
vor 17 Tagen

Part-of-Speech Tagging für Twitter mit adversarialen neuronalen Netzwerken

{Haoran Huang, Xuanjing Huang, Tao Gui, Minlong Peng, Qi Zhang}
Part-of-Speech Tagging für Twitter mit adversarialen neuronalen Netzwerken
Abstract

In dieser Arbeit untersuchen wir das Problem der Wortarten-Kennzeichnung für Tweets. Im Gegensatz zu Nachrichtenartikeln sind Tweets in der Regel informell und enthalten zahlreiche Wörter, die außerhalb des Vokabulars liegen. Zudem fehlen für diesen Bereich große, gut annotierte Datensätze. Um diesen Herausforderungen zu begegnen, schlagen wir ein neuartiges neuronales Netzwerk vor, das sowohl annotierte Daten aus anderen Domänen, unannotierte Daten aus der Ziel-Domäne als auch annotierte Daten aus der Ziel-Domäne nutzt. Inspiriert von adversarialen neuronalen Netzwerken versucht die vorgeschlagene Methode, gemeinsame Merkmale durch einen adversarialen Diskriminator zu lernen. Zudem gehen wir davon aus, dass domänenspezifische Merkmale der Ziel-Domäne in gewissem Maße erhalten bleiben sollten. Daher verwendet die vorgeschlagene Methode einen sequenz-zu-Sequenz-Autoencoder, um diese Aufgabe zu erfüllen. Experimentelle Ergebnisse auf drei verschiedenen Datensätzen zeigen, dass unsere Methode eine bessere Leistung als aktuelle state-of-the-art-Verfahren erzielt.