مجموعة بيانات استدلال اللاما-نيموترون
التاريخ
الحجم
رابط النشر
العلامات
هذه المجموعة من البيانات هي مجموعة بيانات استدلالية عالية الجودة متعددة المجالات أصدرتها شركة NVIDIA في عام 2025. نتائج الورقة البحثية ذات الصلة هي:لاما-نيموترون: نماذج استدلال فعّالة"يهدف هذا المشروع إلى دعم تحسين أداء نماذج اللغة الكبيرة في المهام مثل الرياضيات والترميز والاستدلال العلمي واتباع التعليمات، ومساعدة نماذج سلسلة Llama-3.1/3.3-Nemotron على تحقيق قدرات استدلال أكثر كفاءة.
تحتوي مجموعة البيانات على ما يقرب من 22.06 مليون بيانات رياضية، وحوالي 10.1 مليون بيانات برمجية، والباقي عبارة عن بيانات في مجالات العلوم والتعليم التالية. يتم إنشاء البيانات بشكل تعاوني من خلال نماذج متعددة مثل Llama-3.3-70B-Instruct، وDeepSeek-R1، وQwen-2.5، والتي تغطي أنماط التفكير المتنوعة ومسارات حل المشكلات لتلبية الاحتياجات المتنوعة لتدريب النماذج واسعة النطاق.