HyperAI

مجموعة بيانات Seq-Monkey Sequence Monkey مفتوحة المصدر 1.0

التاريخ

منذ عام واحد

الحجم

10.73 GB

المؤسسة

رابط النشر

github.com

Sequence Monkey هو نموذج لغوي واسع النطاق تقدمه شركة Mobvoi.مجموعة بيانات Sequence Monkey هي مجموعة بيانات تستخدم لتدريب نموذج Sequence Monkey. أصبح جزء من مجموعة البيانات مفتوحًا للجمهور الآن.

تغطي النسخة 1.0 من مجموعة البيانات المجالات التالية: مجموعة النصوص الصينية العامة، ومجموعة نصوص ترجمة الشعر القديم، ومجموعة نصوص توليد النصوص. ومن بينها مجموعة النصوص العامة الصينية التي تتكون من 13 مليون بيانات تم استخراجها من مجموعة تدريب Sequence Monkey وهي مفتوحة للجمهور. مجموعة البيانات مفتوحة المصدر لترجمة الشعر القديم هي مجموعة بيانات لترجمات النصوص القديمة والحديثة، حيث تضم 680 ألف قصيدة مفتوحة للجمهور. توفر مجموعة بيانات ضبط إنشاء النص 5000 بيانات مفتوحة للإجابة على الأسئلة، والتي يمكن استخدامها في مهام اكتشاف أخطاء الكلمات وتصحيح أخطاء الكلمات وصقل النص.

seq-monkey.torrent
البذر 2التنزيل 1مكتمل 259إجمالي التنزيلات 590
  • seq-monkey/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • seq-monkey-data-main 2.zip
          10.73 GB