HyperAI

مجموعة بيانات تدريب مسائل البرمجة الرياضية Eurus-2-RL-Data

التاريخ

منذ 4 أشهر

الحجم

1.16 GB

رابط النشر

huggingface.co

Eurus-2-RL-Data عبارة عن مجموعة بيانات عالية الجودة مخصصة لتدريب التعلم المعزز، وتستخدم بشكل أساسي في حل المشكلات الرياضية والبرمجية. المدونة ذات الصلة هي "تعزيز العملية من خلال المكافآت الضمنية".

مسائل الرياضيات في هذه المجموعة من البيانات مستمدة جزئيًا من NuminaMath-CoT، وتغطي مجموعة واسعة من المواضيع من رياضيات المدارس الثانوية الصينية إلى أولمبياد الرياضيات الدولي. تأتي أسئلة البرمجة من منصات متعددة، بما في ذلك APPS وCodeContests وTACO وCodeforces، وتستهدف بشكل أساسي أسئلة مستوى المسابقات البرمجية. ولضمان جودة البيانات، تم تنظيف وتصفية Eurus-2-RL-Data بدقة. تم فحص الأسئلة الرياضية باستخدام نماذج التفكير المتقدمة (على سبيل المثال، Qwen-QwQ) لإزالة الأسئلة غير القابلة للحل أو غير المتطابقة أو التي تمت الإجابة عليها بشكل خاطئ، وتم تحويل أسئلة الاختيار من متعدد إلى أسئلة مفتوحة. أسئلة البرمجة تعمل بشكل رئيسي على إزالة المحتوى المتكرر. بعد هذه العلاجات،تحتوي مجموعة البيانات في النهاية على حوالي 455 ألف مسألة رياضية و27 ألف مسألة برمجة. مجالات التطبيق الرئيسية لـ Eurus-2-RL-Data هي التعلم المعزز ومسابقات البرمجة. إنه يوفر منصة تدريب فعالة للنموذج، مما يساعده على التعلم بشكل أعمق وتحسين أدائه عند حل المشكلات المعقدة.

Eurus-2-RL-Data.torrent
البذر 0التنزيل 1مكتمل 54إجمالي التنزيلات 34
  • Eurus-2-RL-Data/
    • README.md
      1.82 KB
    • README.txt
      3.64 KB
      • data/
        • Eurus-2-RL-Data.zip
          1.16 GB