HyperAIHyperAI

مجموعة بيانات ترميز KodCode-V1 الاصطناعية

التاريخ

منذ 6 أشهر

الحجم

1.99 GB

المؤسسة

مايكروسوفت
جامعة واشنطن

رابط النشر

kodcode-ai.github.io

رابط الورقة البحثية

arxiv.org

الترخيص

CC BY 4.0

العلامات

تم إصدار KodCode في عام 2025 بواسطة باحثين من Microsoft GenAI وجامعة واشنطن وجامعة تكساس في أوستن.KodCode: مجموعة بيانات تركيبية متنوعة وتحديات وقابلة للتحقق للترميز".

تُعد مجموعة البيانات أكبر مجموعة بيانات مفتوحة المصدر مصنعة بالكامل توفر حلولاً واختبارات قابلة للتحقق لمهام الترميز. يحتوي الكتاب على 12 مجموعة فرعية مختلفة تغطي مجالات مختلفة (من الخوارزميات إلى المعرفة الخاصة بالحزمة) ومستويات الصعوبة (من تمارين الترميز الأساسية إلى المقابلات وتحديات البرمجة التنافسية)، وهو مصمم للضبط الدقيق الخاضع للإشراف (SFT) والضبط التعزيزي.

يوضح الشكل عملية مكونة من 3 خطوات لتوليد KodCode-V1: ترميز تركيب المشكلة، وتوليد الحل والاختبار، وتوليف البيانات بعد التدريب. تحتوي مجموعة البيانات النهائية KodCode-V1 على 447 ألف ثلاثية من الأسئلة والحلول والاختبارات التي تم التحقق منها. يظهر توزيع كل مجموعة فرعية على اليمين.
كود كود-V1.torrent
البذر 1التنزيل 0مكتمل 63إجمالي التنزيلات 115
  • KodCode-V1/
    • README.md
      1.61 KB
    • README.txt
      3.21 KB
      • data/
        • KodCode-V1.zip
          1.99 GB
مجموعة بيانات ترميز KodCode-V1 الاصطناعية | مجموعات البيانات | HyperAI