HyperAIHyperAI

Command Palette

Search for a command to run...

Verbesserung der chinesischen Wortsegmentierung mit Wordhood Memory Networks

Yan Song Yuanhe Tian Yonggang Wang Fei Xia Tong Zhang

Zusammenfassung

Kontextuelle Merkmale spielen stets eine wichtige Rolle bei der chinesischen Wortsegmentierung (CWS). Die Wortheit (wordhood)-Information, als eines der kontextuellen Merkmale, hat sich in vielen herkömmlichen zeichenbasierten Segmentierern als nützlich erwiesen. In jüngeren neuronalen Modellen erhält dieses Merkmal jedoch weniger Aufmerksamkeit, und es ist herausfordernd, einen Rahmen zu entwerfen, der die Wortheit-Information aus verschiedenen Wortheit-Maßen effektiv in bestehende neuronale Architekturen integrieren kann. In dieser Arbeit schlagen wir daher ein neuronales Framework, WMSeg, vor, das Speichernetzwerke nutzt, um Wortheit-Information mit mehreren gängigen Encoder-Decoder-Kombinationen für die CWS zu kombinieren. Experimentelle Ergebnisse auf fünf Benchmark-Datensätzen zeigen, dass die Speichermechanismen die Wortheit-Information erfolgreich modellieren und WMSeg auf allen diesen Datensätzen eine state-of-the-art-Leistung erzielt. Weitere Experimente und Analysen belegen zudem die Robustheit unseres vorgeschlagenen Frameworks gegenüber unterschiedlichen Wortheit-Maßen sowie die Effizienz der Wortheit-Information in cross-domain-Experimenten.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp