HyperAIHyperAI

Command Palette

Search for a command to run...

FCGEC-Datensatz Zur Erkennung Und Korrektur Chinesischer Grammatikfehler

Date

vor 2 Jahren

Size

15.51 MB

Organization

Huawei
Zhejiang-Universität

Publish URL

github.com

Paper URL

arxiv.org

License

Non-Commercial

FCGEC steht für Fine-Grained Corpus for Chinese Grammatical Error Correction. Es handelt sich um ein umfangreiches, mehrreferenziertes Textfehlerkorrekturkorpus von Muttersprachlern.  Die Datenquelle wird zum Trainieren und Bewerten des Fehlerkorrekturmodellsystems verwendet und besteht hauptsächlich aus Testfragen zu falschen Sätzen von Grund-, Mittel- und Oberstufenschülern sowie aus Nachrichtenaggregations-Websites.

Um mehr Methoden zur Referenzänderung für Sätze bereitzustellen und so unterschiedliche Annotationsziele zu erreichen, wird jeder Satz zufällig 2–4 Annotatoren zur Annotation zugewiesen.Wir haben 54.026 Originalsätze aus zwei Datenquellen gesammelt. Nach dem Entfernen doppelter Sätze und dem Herausfiltern problematischer Sätze (wie z. B. abgeschnittener Texte) enthält FCGEC insgesamt 41.340 Sätze.

FCGEC.torrent
Seeding 2Downloading 0Completed 214Total Downloads 563
  • FCGEC/
    • README.md
      1.33 KB
    • README.txt
      2.65 KB
      • data/
        • FCGEC_test.json
          815.18 KB
        • FCGEC_train.json
          14.73 MB
        • FCGEC_valid.json
          15.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp