HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

PromptCoT-2.0-SFT-4.8M Überwachter Feinabstimmungs-Prompt-SFT-Datensatz

Datum

vor 2 Monaten

Größe

21.79 GB

Organisation

Die Universität von Hongkong
Ameisengruppe

Paper-URL

2509.19894

Lizenz

MIT

PromptCoT-2.0-SFT-4.8M ist ein groß angelegter synthetischer Prompt-Datensatz, der vom Forschungsteam der Universität Hongkong und der Ant Group im Jahr 2025 veröffentlicht wurde. Die zugehörigen Papierergebnisse sind „PromptCoT 2.0: Skalierung der Promptsynthese für das Denken in großen Sprachmodellen“, dessen Ziel es ist, ein hochwertiges Korpus für Schlussfolgerungsaufforderungen für große Sprachmodelle zur Feinabstimmung oder zum Selbsttraining bereitzustellen.

Der Datensatz enthält ungefähr 4,8 Millionen vollständig synthetische Eingabeaufforderungen mit Denkverläufen sowohl in Szenarien mit überwachter Feinabstimmung als auch in Szenarien zum Selbstüben und deckt zwei wichtige Denkbereiche ab: Mathematik und Programmierung.

Datenzusammensetzung:

  • Im Szenario der überwachten Feinabstimmung (SFT) wurden insgesamt 4.766.890 Eingabeaufforderungen synthetisiert, darunter:
    • 1.188.505 Programmieraufgabenaufforderungen
    • 3.578.385 Mathe-Aufgaben

PromptCoT-2.0-SFT-4.8M.torrent
Seeding 2Herunterladen 0Abgeschlossen 21Gesamtdownloads 76
  • PromptCoT-2.0-SFT-4.8M/
    • README.md
      1.53 KB
    • README.txt
      3.06 KB
      • data/
        • PromptCoT-2.0-SFT-4.8M.zip
          21.79 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp