HyperAI

مجموعة بيانات تدريب AceMath Instruct - مجموعة بيانات الاستدلال الرياضي

التاريخ

منذ 4 أشهر

الحجم

4.82 GB

المؤسسة

إنفيديا

رابط النشر

huggingface.co

بيانات تدريب AceMath Instruct هي مجموعة بيانات أصدرتها NVIDIA في عام 2025 لتدريب نماذج AceMath، بهدف تحسين أداء النموذج في مهام التفكير الرياضي. "نتائج الورقة ذات الصلة هي"AceMath: تطوير التفكير الرياضي الرائد باستخدام نمذجة ما بعد التدريب والمكافأة".

تحتوي مجموعة البيانات هذه على مراحل متعددة من ضبط البيانات بدقة. general_sft_stage1 يحتوي على 2,261,687 عينة، تغطي بشكل أساسي عينات الضبط الدقيق للتعليمات في مجالات البرمجة والرياضيات؛ general_sft_stage2 يحتوي على 1,634,573 عينة، ممتدة بشكل أكبر إلى الكود والرياضيات وضبط تعليمات المجال العام؛ وخاصة في مجال الرياضيات math_sft ويحتوي على 1,661,094 عينة ويركز على تحسين مهارات التفكير الرياضي. يجمع إنشاء هذه البيانات بين نموذجي Qwen2.5-Math-72B-Instruct وGPT-4o-mini لضمان تنوع البيانات وجودتها العالية.

AceMath-Instruct-Training-Data.torrent
البذر 1التنزيل 1مكتمل 29إجمالي التنزيلات 36
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB