HyperAI

مجموعة بيانات الاستدلال الرياضي OpenR1-Math-220k

التاريخ

منذ 2 أشهر

الحجم

3.51 GB

المؤسسة

رابط النشر

huggingface.co

الترخيص

Apache 2.0

OpenR1-Math-220k عبارة عن مجموعة بيانات تفكير رياضي واسعة النطاق أصدرها فريق Open R1 في عام 2025 لسد الفجوة في البيانات الاصطناعية لـ DeepSeek R1. تحتوي مجموعة البيانات على 220,000 مسألة رياضية عالية الجودة ومسارات التفكير الخاصة بها، والتي تم استخلاصها من 800,000 مسار تفكير تم إنشاؤه بواسطة DeepSeek R1.

تنقسم مجموعة البيانات إلى قسمين:

  • افتراضيًا (94 ألف إصدار):يحقق هذا الجزء من البيانات أفضل أداء بعد الضبط الدقيق الخاضع للإشراف (SFT).
  • ممتد (131 ألف سؤال):يحتوي هذا الجزء من البيانات على مصادر بيانات NuminaMath 1.5 إضافية، مثل cn_k12، الذي يوفر المزيد من صيغ الاستدلال.
OpenR1-Math-220k.torrent
البذر 0التنزيل 1مكتمل 29إجمالي التنزيلات 57
  • OpenR1-Math-220k/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • OpenR1-Math-220k.zip
          3.51 GB