Command Palette
Search for a command to run...
KodCode-V1-Kodierung Des Synthetischen Datensatzes
Date
Size
Publish URL
Paper URL
License
CC BY 4.0
KodCode wurde 2025 von Forschern von Microsoft GenAI, der University of Washington und der University of Texas in Austin veröffentlicht.KodCode: Ein vielfältiger, anspruchsvoller und überprüfbarer synthetischer Datensatz für die Codierung".
Der Datensatz ist der größte vollständig synthetische Open-Source-Datensatz, der überprüfbare Lösungen und Tests für Codierungsaufgaben bietet. Es enthält 12 verschiedene Teilmengen, die verschiedene Bereiche (von Algorithmen bis zu paketspezifischem Wissen) und Schwierigkeitsgrade (von grundlegenden Codierungsübungen bis zu Interviews und wettbewerbsorientierten Programmierherausforderungen) abdecken und ist für überwachtes Feintuning (SFT) und RL-Tuning konzipiert.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.