HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الاستدلال الرياضي Nemotron-Math-v2

التاريخ

منذ 22 أيام

المؤسسة

إنفيديا

رابط الورقة البحثية

2512.15489

الترخيص

CC BY-SA 4.0

Nemotron-Math-v2 هي مجموعة بيانات للاستدلال الرياضي أصدرتها شركة NVIDIA في عام 2025. وتشمل الأبحاث ذات الصلة ما يلي... نيموترون-ماث: تقطير فعال طويل السياق للاستدلال الرياضي من خلال الإشراف متعدد الأنماط يُستخدم بشكل أساسي لتدريب نماذج اللغة على أداء الاستدلال الرياضي المنظم، ودراسة الاختلافات بين الاستدلال المعزز بالأدوات والاستدلال اللغوي البحت، وبناء أنظمة الاستدلال طويلة السياق أو متعددة المسارات.

تحتوي هذه المجموعة من البيانات على ما يقارب 347,000 مسألة رياضية عالية الجودة و7 ملايين مسار استدلال مُولّد بواسطة النموذج. تُحل كل مسألة في ستة تكوينات: عمق استدلال عالٍ/متوسط/منخفض، مع أو بدون استخدام تقنية TIR في بايثون، ويتم التحقق من صحة الإجابات عبر مسار معالجة باستخدام نموذج خطي للتعلم (LLM) كمعيار للحكم.

حقول البيانات:

  • المشكلة: تم استخراج بيانات المشكلة من مصادر مثل OpenMathReasoning و MathStackExchange.
  • الرسائل: سجل محادثات المستخدم والمساعد، المستخدم في تدريب برنامج ماجستير القانون.
  • الإجابة المتوقعة: الإجابة المستخرجة أو إجابة التصويت بالأغلبية التي تم إنشاؤها بواسطة النموذج.
  • البيانات الوصفية: معدل النجاح في ظل سيناريوهات مختلفة للاستدلال واستخدام الأدوات
  • مصدر البيانات: مصدر البيانات هو AoPS أو StackExchange-Math
  • الأداة: تعريف الأداة المستخدم، أو فارغ.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp