HyperAI

مجموعة بيانات استدلال البرمجة OpenCodeReasoning

التاريخ

منذ 19 أيام

المؤسسة

إنفيديا

رابط النشر

huggingface.co

مساعدة التنزيل

OpenCodeReasoning هي مجموعة بيانات تركيبية واسعة النطاق للتفكير البرمجي أصدرتها NVIDIA في عام 2025. وتهدف إلى توفير بيانات تدريب عالية الجودة للتفكير البرمجي لنماذج اللغة الكبيرة (LLMs) وتعزيز تحسين قدرات توليد التعليمات البرمجية والتفكير المنطقي. نتائج الورقة ذات الصلة هي:OpenCodeReasoning: تطوير تقطير البيانات للترميز التنافسي".

تحتوي مجموعة البيانات على 735,255 عينة، تغطي 28,319 سؤال برمجة فريدًا، وهي واحدة من أكبر مجموعات بيانات البرمجة المنطقية المتوفرة حاليًا.

مصدر البيانات:

  • إنه يدمج الأسئلة من 11 منصة برمجة رئيسية، بما في ذلك CodeForces، وCodeChef، وLeetCode، ومجموعات البيانات العامة مثل TACO، وAPPS، وCodeContests.
  • يتم إنشاء استجابة الكود بواسطة النموذج R1 الذي طورته NVIDIA ذاتيًا لضمان اتساق البيانات وتوحيد منطق التفكير.