HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكشف عن أخطاء قواعد اللغة الصينية وتصحيحها من FCGEC

التاريخ

منذ 2 أعوام

الحجم

15.51 MB

المؤسسة

هواوي
جامعة تشجيانغ

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

الترخيص

Non-Commercial

FCGEC تعني مجموعة من النصوص الدقيقة لتصحيح الأخطاء النحوية الصينية. وهو عبارة عن مجموعة كبيرة من النصوص المرجعية لتصحيح الأخطاء للمتحدثين الأصليين.  تُستخدم لتدريب وتقييم نظام نموذج تصحيح الأخطاء، والمصدر الرئيسي للبيانات هو أسئلة اختبار الجمل غير الصحيحة لطلاب المدارس الابتدائية والمتوسطة والثانوية ومواقع تجميع الأخبار.

من أجل توفير المزيد من طرق تعديل المراجع للجمل لتحقيق أهداف التوضيح المتنوعة، سيتم تعيين كل جملة بشكل عشوائي إلى 2-4 معلقين للتوضيح.لقد جمعنا 54,026 جملة أصلية من مصدرين للبيانات. بعد إزالة الجمل المكررة وتصفية الجمل الإشكالية (مثل اقتطاع النص)، يحتوي FCGEC على إجمالي 41340 جملة.

FCGEC.torrent
البذر 2جارٍ التنزيل 0مكتمل 229إجمالي التنزيلات 572
  • FCGEC/
    • README.md
      1.33 KB
    • README.txt
      2.65 KB
      • data/
        • FCGEC_test.json
          815.18 KB
        • FCGEC_train.json
          14.73 MB
        • FCGEC_valid.json
          15.51 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp