HyperAIHyperAI

Command Palette

Search for a command to run...

NextCoder-Code-Bearbeitungsdatensatz

Datum

vor 4 Monaten

Größe

235.34 MB

Organisation

Microsoft

Lizenz

MIT

NextCoder ist ein synthetischer Datensatz zur Bearbeitung von Dialogcodierungen, der 2025 von Microsoft veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie sind:NextCoder: Robuste Anpassung von Code-LMs an verschiedene Code-EditierungenEs wird hauptsächlich zur Feinabstimmung großer Sprachmodelle verwendet und trägt dazu bei, die Leistung des Modells bei der Codereparatur, Refaktorierung und Optimierung zu verbessern. Es eignet sich sehr gut zum Trainieren von KI-Programmierassistenten und zur Verbesserung der Codelese- und Mehrrunden-Interaktionsfähigkeiten.

Der Datensatz enthält etwa 381.000 Beispiele für einstufige Anweisungen (NextCoderDataset) und 57.000 Beispiele für mehrstufige Dialoge (Konversationsversion) und deckt 8 Sprachen ab, darunter Python, Java, C++, C, Rust, JavaScript, Go, Kotlin usw. Die Daten werden von den Modellen GPT‑4o und LLaMA‑3.3‑70B‑Instruct generiert.

Datenverteilung:

  • JavaScript: 16030
  • Python: 15279
  • C:17153
  • C++: 17337
  • Rost: 16438
  • Los: 15204
  • Kotlin: 13272
  • Java: 16328
NextCoder.torrent
Seeding 1Herunterladen 0Abgeschlossen 38Gesamtdownloads 103
  • NextCoder/
    • README.md
      1.53 KB
    • README.txt
      3.07 KB
      • data/
        • NextCoder.zip
          235.34 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp