HyperAIHyperAI

Command Palette

Search for a command to run...

NextCoder-Code-Bearbeitungsdatensatz

Date

vor 5 Monaten

Size

235.34 MB

Organization

Microsoft

License

MIT

NextCoder ist ein synthetischer Datensatz zur Bearbeitung von Dialogcodierungen, der 2025 von Microsoft veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie sind:NextCoder: Robuste Anpassung von Code-LMs an verschiedene Code-EditierungenEs wird hauptsächlich zur Feinabstimmung großer Sprachmodelle verwendet und trägt dazu bei, die Leistung des Modells bei der Codereparatur, Refaktorierung und Optimierung zu verbessern. Es eignet sich sehr gut zum Trainieren von KI-Programmierassistenten und zur Verbesserung der Codelese- und Mehrrunden-Interaktionsfähigkeiten.

Der Datensatz enthält etwa 381.000 Beispiele für einstufige Anweisungen (NextCoderDataset) und 57.000 Beispiele für mehrstufige Dialoge (Konversationsversion) und deckt 8 Sprachen ab, darunter Python, Java, C++, C, Rust, JavaScript, Go, Kotlin usw. Die Daten werden von den Modellen GPT‑4o und LLaMA‑3.3‑70B‑Instruct generiert.

Datenverteilung:

  • JavaScript: 16030
  • Python: 15279
  • C:17153
  • C++: 17337
  • Rost: 16438
  • Los: 15204
  • Kotlin: 13272
  • Java: 16328
NextCoder.torrent
Seeding 1Downloading 0Completed 40Total Downloads 139
  • NextCoder/
    • README.md
      1.53 KB
    • README.txt
      3.07 KB
      • data/
        • NextCoder.zip
          235.34 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp