HyperAIHyperAI

Command Palette

Search for a command to run...

PromptCoT-2.0-SFT-4.8M Überwachter Feinabstimmungs-Prompt-SFT-Datensatz

Datum

vor 4 Monaten

Größe

21.79 GB

Organisation

Die Universität von Hongkong
Ameisengruppe

Paper-URL

2509.19894

Lizenz

MIT

PromptCoT-2.0-SFT-4.8M ist ein groß angelegter synthetischer Prompt-Datensatz, der vom Forschungsteam der Universität Hongkong und der Ant Group im Jahr 2025 veröffentlicht wurde. Die zugehörigen Papierergebnisse sind „PromptCoT 2.0: Skalierung der Promptsynthese für das Denken in großen Sprachmodellen“, dessen Ziel es ist, ein hochwertiges Korpus für Schlussfolgerungsaufforderungen für große Sprachmodelle zur Feinabstimmung oder zum Selbsttraining bereitzustellen.

Der Datensatz enthält ungefähr 4,8 Millionen vollständig synthetische Eingabeaufforderungen mit Denkverläufen sowohl in Szenarien mit überwachter Feinabstimmung als auch in Szenarien zum Selbstüben und deckt zwei wichtige Denkbereiche ab: Mathematik und Programmierung.

Datenzusammensetzung:

  • Im Szenario der überwachten Feinabstimmung (SFT) wurden insgesamt 4.766.890 Eingabeaufforderungen synthetisiert, darunter:
    • 1.188.505 Programmieraufgabenaufforderungen
    • 3.578.385 Mathe-Aufgaben

PromptCoT-2.0-SFT-4.8M.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 34Gesamtdownloads 99
  • PromptCoT-2.0-SFT-4.8M/
    • README.md
      1.53 KB
    • README.txt
      3.06 KB
      • data/
        • PromptCoT-2.0-SFT-4.8M.zip
          21.79 GB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp