HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Détection Et De Correction Des Erreurs De Grammaire Chinoise FCGEC

Date

il y a 2 ans

Size

15.51 MB

Organization

Huawei
Université du Zhejiang

Publish URL

github.com

Paper URL

arxiv.org

License

Non-Commercial

FCGEC signifie Corpus à grain fin pour la correction des erreurs grammaticales chinoises. Il s'agit d'un corpus de correction d'erreurs de texte multi-références à grande échelle de locuteurs natifs.  Utilisée pour former et évaluer le système de modèle de correction d'erreurs, la source de données est principalement constituée de questions de test de phrases incorrectes d'élèves du primaire, du collège et du lycée et de sites Web d'agrégation de nouvelles.

Afin de fournir davantage de méthodes de modification de référence pour les phrases afin d'atteindre divers objectifs d'annotation, chaque phrase sera attribuée aléatoirement à 2 à 4 annotateurs pour l'annotation.Nous avons recueilli 54 026 phrases originales à partir de deux sources de données. Après avoir supprimé les phrases en double et filtré les phrases problématiques (telles que la troncature du texte), FCGEC contient un total de 41 340 phrases.

FCGEC.torrent
Seeding 2Downloading 0Completed 214Total Downloads 563
  • FCGEC/
    • README.md
      1.33 KB
    • README.txt
      2.65 KB
      • data/
        • FCGEC_test.json
          815.18 KB
        • FCGEC_train.json
          14.73 MB
        • FCGEC_valid.json
          15.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Détection Et De Correction Des Erreurs De Grammaire Chinoise FCGEC | Datasets | HyperAI