HyperAIHyperAI

Command Palette

Search for a command to run...

KodCode-V1-Kodierung Des Synthetischen Datensatzes

Datum

vor 8 Monaten

Größe

1.99 GB

Organisation

Microsoft
Universität von Washington

Veröffentlichungs-URL

kodcode-ai.github.io

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

KodCode wurde 2025 von Forschern von Microsoft GenAI, der University of Washington und der University of Texas in Austin veröffentlicht.KodCode: Ein vielfältiger, anspruchsvoller und überprüfbarer synthetischer Datensatz für die Codierung".

Der Datensatz ist der größte vollständig synthetische Open-Source-Datensatz, der überprüfbare Lösungen und Tests für Codierungsaufgaben bietet. Es enthält 12 verschiedene Teilmengen, die verschiedene Bereiche (von Algorithmen bis zu paketspezifischem Wissen) und Schwierigkeitsgrade (von grundlegenden Codierungsübungen bis zu Interviews und wettbewerbsorientierten Programmierherausforderungen) abdecken und ist für überwachtes Feintuning (SFT) und RL-Tuning konzipiert.

Die Abbildung veranschaulicht den dreistufigen Prozess der Generierung von KodCode-V1: Synthese des Codierungsproblems, Generierung von Lösungen und Tests sowie Synthese der Daten nach dem Training. Der endgültige KodCode-V1-Datensatz enthält 447.000 verifizierte Frage-Lösung-Test-Tripel. Die Verteilung jeder Teilmenge wird rechts angezeigt.
KodCode-V1.torrent
Seeding 1Herunterladen 0Abgeschlossen 72Gesamtdownloads 143
  • KodCode-V1/
    • README.md
      1.61 KB
    • README.txt
      3.21 KB
      • data/
        • KodCode-V1.zip
          1.99 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp