مجموعة بيانات استدلال البرمجة OpenCodeReasoning
التاريخ
منذ 19 أيام
رابط النشر
الفئات
OpenCodeReasoning هي مجموعة بيانات تركيبية واسعة النطاق للتفكير البرمجي أصدرتها NVIDIA في عام 2025. وتهدف إلى توفير بيانات تدريب عالية الجودة للتفكير البرمجي لنماذج اللغة الكبيرة (LLMs) وتعزيز تحسين قدرات توليد التعليمات البرمجية والتفكير المنطقي. نتائج الورقة ذات الصلة هي:OpenCodeReasoning: تطوير تقطير البيانات للترميز التنافسي".
تحتوي مجموعة البيانات على 735,255 عينة، تغطي 28,319 سؤال برمجة فريدًا، وهي واحدة من أكبر مجموعات بيانات البرمجة المنطقية المتوفرة حاليًا.
مصدر البيانات:
- إنه يدمج الأسئلة من 11 منصة برمجة رئيسية، بما في ذلك CodeForces، وCodeChef، وLeetCode، ومجموعات البيانات العامة مثل TACO، وAPPS، وCodeContests.
- يتم إنشاء استجابة الكود بواسطة النموذج R1 الذي طورته NVIDIA ذاتيًا لضمان اتساق البيانات وتوحيد منطق التفكير.