HyperAI

مجموعة بيانات أخبار NLPCC2016

التاريخ

منذ 2 أعوام

الحجم

18.29 MB

المؤسسة

جامعة فودان

رابط النشر

github.com

الترخيص

其他

تختلف مجموعة بيانات NLPCC2016 عن مجموعات بيانات الأخبار الشائعة وتستخدم نصًا غير رسمي من Sina Weibo. تتكون بيانات التدريب والاختبار من مدونات صغيرة من مواضيع مختلفة، مثل التمويل والرياضة والترفيه وما إلى ذلك. تم ترميز مجموعة البيانات هذه بتنسيق UTF-8 ويمكن استخدامها لمهام تقسيم الكلمات الصينية.

NLPCC2016.torrent
البذر 3التنزيل 0مكتمل 974إجمالي التنزيلات 2,218
  • NLPCC2016/
    • README.md
      928 字节
    • README.txt
      1.81 KB
      • data/
        • master.zip
          18.29 MB