HyperAI

مجموعة بيانات ترميز KodCode-V1 الاصطناعية

التاريخ

منذ 2 أشهر

الحجم

1.99 GB

المؤسسة

مايكروسوفت
جامعة واشنطن

رابط النشر

kodcode-ai.github.io

الترخيص

CC BY 4.0

تم إصدار KodCode في عام 2025 بواسطة باحثين من Microsoft GenAI وجامعة واشنطن وجامعة تكساس في أوستن.KodCode: مجموعة بيانات تركيبية متنوعة وتحديات وقابلة للتحقق للترميز".

تُعد مجموعة البيانات أكبر مجموعة بيانات مفتوحة المصدر مصنعة بالكامل توفر حلولاً واختبارات قابلة للتحقق لمهام الترميز. يحتوي الكتاب على 12 مجموعة فرعية مختلفة تغطي مجالات مختلفة (من الخوارزميات إلى المعرفة الخاصة بالحزمة) ومستويات الصعوبة (من تمارين الترميز الأساسية إلى المقابلات وتحديات البرمجة التنافسية)، وهو مصمم للضبط الدقيق الخاضع للإشراف (SFT) والضبط التعزيزي.

يوضح الشكل عملية مكونة من 3 خطوات لتوليد KodCode-V1: ترميز تركيب المشكلة، وتوليد الحل والاختبار، وتوليف البيانات بعد التدريب. تحتوي مجموعة البيانات النهائية KodCode-V1 على 447 ألف ثلاثية من الأسئلة والحلول والاختبارات التي تم التحقق منها. يظهر توزيع كل مجموعة فرعية على اليمين.
KodCode-V1.torrent
البذر 1التنزيل 2مكتمل 24إجمالي التنزيلات 26
  • KodCode-V1/
    • README.md
      1.61 KB
    • README.txt
      3.21 KB
      • data/
        • KodCode-V1.zip
          1.99 GB