HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكشف عن أخطاء قواعد اللغة الصينية وتصحيحها من FCGEC

Date

منذ 2 أعوام

Size

15.51 MB

Organization

هواوي
جامعة تشجيانغ

Publish URL

github.com

Paper URL

arxiv.org

License

Non-Commercial

FCGEC تعني مجموعة من النصوص الدقيقة لتصحيح الأخطاء النحوية الصينية. وهو عبارة عن مجموعة كبيرة من النصوص المرجعية لتصحيح الأخطاء للمتحدثين الأصليين.  تُستخدم لتدريب وتقييم نظام نموذج تصحيح الأخطاء، والمصدر الرئيسي للبيانات هو أسئلة اختبار الجمل غير الصحيحة لطلاب المدارس الابتدائية والمتوسطة والثانوية ومواقع تجميع الأخبار.

من أجل توفير المزيد من طرق تعديل المراجع للجمل لتحقيق أهداف التوضيح المتنوعة، سيتم تعيين كل جملة بشكل عشوائي إلى 2-4 معلقين للتوضيح.لقد جمعنا 54,026 جملة أصلية من مصدرين للبيانات. بعد إزالة الجمل المكررة وتصفية الجمل الإشكالية (مثل اقتطاع النص)، يحتوي FCGEC على إجمالي 41340 جملة.

FCGEC.torrent
Seeding 2Downloading 0Completed 214Total Downloads 563
  • FCGEC/
    • README.md
      1.33 KB
    • README.txt
      2.65 KB
      • data/
        • FCGEC_test.json
          815.18 KB
        • FCGEC_train.json
          14.73 MB
        • FCGEC_valid.json
          15.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp