Command Palette
Search for a command to run...
مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2
Nemotron-Math-v2 هي مجموعة بيانات للاستدلال الرياضي أصدرتها شركة NVIDIA في عام 2025. وتشمل الأبحاث ذات الصلة ما يلي... نيموترون-ماث: تقطير فعال طويل السياق للاستدلال الرياضي من خلال الإشراف متعدد الأنماط يُستخدم بشكل أساسي لتدريب نماذج اللغة على أداء الاستدلال الرياضي المنظم، ودراسة الاختلافات بين الاستدلال المعزز بالأدوات والاستدلال اللغوي البحت، وبناء أنظمة الاستدلال طويلة السياق أو متعددة المسارات.
تحتوي هذه المجموعة من البيانات على ما يقارب 347,000 مسألة رياضية عالية الجودة و7 ملايين مسار استدلال مُولّد بواسطة النموذج. تُحل كل مسألة في ستة تكوينات: عمق استدلال عالٍ/متوسط/منخفض، مع أو بدون استخدام تقنية TIR في بايثون، ويتم التحقق من صحة الإجابات عبر مسار معالجة باستخدام نموذج خطي للتعلم (LLM) كمعيار للحكم.
حقول البيانات:
- المشكلة: تم استخراج بيانات المشكلة من مصادر مثل OpenMathReasoning و MathStackExchange.
- الرسائل: سجل محادثات المستخدم والمساعد، المستخدم في تدريب برنامج ماجستير القانون.
- الإجابة المتوقعة: الإجابة المستخرجة أو إجابة التصويت بالأغلبية التي تم إنشاؤها بواسطة النموذج.
- البيانات الوصفية: معدل النجاح في ظل سيناريوهات مختلفة للاستدلال واستخدام الأدوات
- مصدر البيانات: مصدر البيانات هو AoPS أو StackExchange-Math
- الأداة: تعريف الأداة المستخدم، أو فارغ.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.