مجموعة بيانات تدريب AceMath Instruct - مجموعة بيانات الاستدلال الرياضي
التاريخ
الحجم
رابط النشر
العلامات
الفئات
بيانات تدريب AceMath Instruct هي مجموعة بيانات أصدرتها NVIDIA في عام 2025 لتدريب نماذج AceMath، بهدف تحسين أداء النموذج في مهام التفكير الرياضي. "نتائج الورقة ذات الصلة هي"AceMath: تطوير التفكير الرياضي الرائد باستخدام نمذجة ما بعد التدريب والمكافأة".
تحتوي مجموعة البيانات هذه على مراحل متعددة من ضبط البيانات بدقة. general_sft_stage1
يحتوي على 2,261,687 عينة، تغطي بشكل أساسي عينات الضبط الدقيق للتعليمات في مجالات البرمجة والرياضيات؛ general_sft_stage2
يحتوي على 1,634,573 عينة، ممتدة بشكل أكبر إلى الكود والرياضيات وضبط تعليمات المجال العام؛ وخاصة في مجال الرياضيات math_sft
ويحتوي على 1,661,094 عينة ويركز على تحسين مهارات التفكير الرياضي. يجمع إنشاء هذه البيانات بين نموذجي Qwen2.5-Math-72B-Instruct وGPT-4o-mini لضمان تنوع البيانات وجودتها العالية.