HyperAIHyperAI

Command Palette

Search for a command to run...

Eurus-2-RL-Data Trainingsdatensatz Für Mathematische Programmierprobleme

Eurus-2-RL-Data ist ein hochwertiger Datensatz speziell für das Training des bestärkenden Lernens, der hauptsächlich zur Lösung mathematischer und Programmierprobleme verwendet wird. Der entsprechende Blog ist „Prozessverstärkung durch implizite Belohnungen".

Die Mathematikaufgaben in diesem Datensatz stammen teilweise aus NuminaMath-CoT und decken ein breites Themenspektrum ab, von der chinesischen Mathematik an weiterführenden Schulen bis zur Internationalen Mathematik-Olympiade. Programmierfragen kommen von mehreren Plattformen, darunter APPS, CodeContests, TACO und Codeforces, und zielen hauptsächlich auf Fragen auf Programmierwettbewerbsniveau ab. Um die Qualität der Daten sicherzustellen, wurden die Eurus-2-RL-Daten gründlich bereinigt und gefiltert. Mathematische Fragen wurden mithilfe erweiterter Denkmodelle (z. B. Qwen-QwQ) gefiltert, um unlösbare, nicht passende oder falsch beantwortete Fragen zu entfernen, und Multiple-Choice-Fragen wurden in offene Fragen umgewandelt. Programmierfragen entfernen hauptsächlich sich wiederholende Inhalte. Nach diesen BehandlungenDer Datensatz enthält letztendlich etwa 455.000 Mathematikprobleme und 27.000 Programmierprobleme. Die Hauptanwendungsgebiete von Eurus-2-RL-Data sind Reinforcement Learning und Programmierwettbewerbe. Es bietet eine effektive Trainingsplattform für das Modell und hilft ihm, tiefer zu lernen und bei der Lösung komplexer Probleme zu optimieren.

Eurus-2-RL-Data.torrent
Seeding 0Wird heruntergeladen 1Abgeschlossen 149Gesamtdownloads 189
  • Eurus-2-RL-Data/
    • README.md
      1.82 KB
    • README.txt
      3.64 KB
      • data/
        • Eurus-2-RL-Data.zip
          1.16 GB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp