HyperAIHyperAI
vor 18 Tagen

Übertragung vom formalen Nachrichtendomäne mit Hypernet für Twitter POS-Tagging

{Xuanjing Huang, Keyu Ding, Di Liang, Tao Gui, Minlong Peng, Qi Zhang, Jingjing Gong}
Übertragung vom formalen Nachrichtendomäne mit Hypernet für Twitter POS-Tagging
Abstract

Die Part-of-Speech-(POS)-Tagging-Verarbeitung für Twitter hat in den letzten Jahren erhebliche Aufmerksamkeit erhalten. Da die meisten POS-Tagging-Methoden auf überwachten Modellen basieren, benötigen sie in der Regel große Mengen an gelabelten Daten für das Training. Allerdings sind die verfügbaren gelabelten Datensätze für Twitter deutlich kleiner als solche für Nachrichtentexte (Newswire). Um die POS-Tagging-Aufgabe für Twitter zu unterstützen, versuchen daher die meisten Methoden zur Domänenanpassung, durch die Identifizierung gemeinsamer Merkmale zwischen den beiden Domänen Newswire und Twitter neue Datensätze aus dem Newswire-Bereich zu nutzen. Aus sprachwissenschaftlicher Sicht jedoch neigen Twitter-Nutzer nicht nur dazu, die formalen Ausdrucksweisen traditioneller Medien wie Nachrichten nachzuahmen, sondern entwickeln auch offenbar linguistisch informelle Stile. Daher kann das POS-Tagging im formellen Kontext von Twitter gemeinsam mit dem Newswire-Datensatz erlernt werden, während das POS-Tagging im informellen Twitter-Kontext separat erlernt werden sollte. Um dieses Ziel zu erreichen, schlagen wir in dieser Arbeit eine auf Hypernetzwerken basierende Methode vor, um unterschiedliche Parameter zu generieren, die es ermöglichen, Kontexte mit unterschiedlichen Ausdrucksstilen getrennt zu modellieren. Experimentelle Ergebnisse auf drei verschiedenen Datensätzen zeigen, dass unser Ansatz in den meisten Fällen eine bessere Leistung als aktuell beste Methoden erzielt.