مجموعة بيانات الاستدلال الرياضي AceReason-1.1-SFT
التاريخ
رابط النشر
AceReason-1.1-SFT هي مجموعة بيانات ضبط دقيق مُشرف (SFT) متنوعة وعالية الجودة، ستصدرها NVIDIA في عام 2025، وتُركز على التفكير الرياضي والبرمجي. نتائج البحث ذات الصلة هي:AceReason-Nemotron 1.1: تطوير الرياضيات والتفكير البرمجي من خلال تآزر SFT وRL"، والذي يهدف إلى تدريب نماذج SFT التي تركز على التفكير الرياضي والبرمجي.
تعمل مجموعة البيانات هذه كنموذج استدلال رياضي وبرمجي AceReason-Nemotron-1.1-7B بيانات تدريب SFT لـ، يتم إنشاء جميع الإجابات في مجموعة البيانات بواسطة DeepSeek-R1.
تحتوي مجموعة بيانات AceReason-1.1-SFT على 2,668,741 عينة رياضية و1,301,591 عينة برمجية، تغطي بيانات من OpenMathReasoning وNuminaMath-CoT وOpenCodeReasoning وMagicoderEvolInstruct وopc-sft-stage2 وleetcode وTACO والتطبيقات. تم تنظيف مجموعة البيانات وتصفية العينات التي تتداخل مع أي عينات اختبار في معايير الرياضيات والبرمجة.