HyperAIHyperAI
vor 17 Tagen

Verbesserung der chinesischen Wortsegmentierung mit Wordhood Memory Networks

{Yan Song, Yuanhe Tian, Yonggang Wang, Fei Xia, Tong Zhang}
Verbesserung der chinesischen Wortsegmentierung mit Wordhood Memory Networks
Abstract

Kontextuelle Merkmale spielen stets eine wichtige Rolle bei der chinesischen Wortsegmentierung (CWS). Die Wortheit (wordhood)-Information, als eines der kontextuellen Merkmale, hat sich in vielen herkömmlichen zeichenbasierten Segmentierern als nützlich erwiesen. In jüngeren neuronalen Modellen erhält dieses Merkmal jedoch weniger Aufmerksamkeit, und es ist herausfordernd, einen Rahmen zu entwerfen, der die Wortheit-Information aus verschiedenen Wortheit-Maßen effektiv in bestehende neuronale Architekturen integrieren kann. In dieser Arbeit schlagen wir daher ein neuronales Framework, WMSeg, vor, das Speichernetzwerke nutzt, um Wortheit-Information mit mehreren gängigen Encoder-Decoder-Kombinationen für die CWS zu kombinieren. Experimentelle Ergebnisse auf fünf Benchmark-Datensätzen zeigen, dass die Speichermechanismen die Wortheit-Information erfolgreich modellieren und WMSeg auf allen diesen Datensätzen eine state-of-the-art-Leistung erzielt. Weitere Experimente und Analysen belegen zudem die Robustheit unseres vorgeschlagenen Frameworks gegenüber unterschiedlichen Wortheit-Maßen sowie die Effizienz der Wortheit-Information in cross-domain-Experimenten.

Verbesserung der chinesischen Wortsegmentierung mit Wordhood Memory Networks | Neueste Forschungsarbeiten | HyperAI