HyperAIHyperAI

Command Palette

Search for a command to run...

FCGEC: Fein granulierter Korpus für die chinesische grammatische Fehlerkorrektur

Lvxiaowei Xu Jianwang Wu Jiawei Peng Jiayu Fu Ming Cai

Zusammenfassung

Die Korrektur grammatikalischer Fehler (GEC) wird in letzter Zeit weitgehend in automatischen Korrektur- und Revisionsystemen eingesetzt. Allerdings ist die chinesische GEC aufgrund der begrenzten hochwertigen Daten von Muttersprachlern hinsichtlich Kategorie und Umfang noch unzureichend entwickelt. In dieser Arbeit stellen wir FCGEC vor, ein feingranuläres Korpus zur Erkennung, Identifikation und Korrektur grammatikalischer Fehler. FCGEC ist ein menschlich annotiertes Korpus mit mehreren Referenzen, das hauptsächlich aus 41.340 Sätzen aus Multiple-Choice-Fragen in öffentlichen Schulprüfungen im Chinesischen besteht. Des Weiteren schlagen wir ein Switch-Tagger-Generator (STG)-Basismodell vor, um grammatikalische Fehler in Ressourcenarmen Szenarien zu korrigieren. Im Vergleich zu anderen GEC-Benchmark-Modellen zeigen experimentelle Ergebnisse, dass STG unseres FCGEC überlegen ist. Dennoch besteht ein erheblicher Unterschied zwischen den Benchmark-Modellen und Menschen, der zukünftige Modelle dazu anregt, diese Lücke zu schließen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp