HyperAIHyperAI

SynLogic-Inferenzdatensatz

Datum

vor 3 Monaten

Größe

50.49 MB

Organisation

Veröffentlichungs-URL

huggingface.co

Kategorien

SynLogic ist ein umfassender synthetischer Logik-Datensatz, der 2025 von der Hong Kong University of Science and Technology und dem MiniMax-Forschungsteam veröffentlicht wurde. Die zugehörigen Ergebnisse sind:SynLogic: Synthese verifizierbarer Schlussfolgerungsdaten im großen Maßstab zum Erlernen logischen Denkens und darüber hinaus", dessen Ziel darin besteht, die Fähigkeit zum logischen Denken großer Sprachmodelle (LLMs) durch bestärkendes Lernen mit überprüfbaren Belohnungen zu verbessern.

Der Datensatz enthält 35 verschiedene Aufgaben zum logischen Denken und verfügt über automatische Validierungsfunktionen, sodass er sich gut für das Training mit bestärkendem Lernen eignet.

Hauptmerkmale

  • 35 Aufgabentypen: darunter Sudoku, 24-Punkte-Spiele, Passwörter, Pfeillabyrinthe, Rechenrätsel usw.
  • Verifizierbarer Bonus: Alle Proben verfügen über einen automatischen Verifizierer zur Richtigkeitsprüfung
  • Steuerbarer Schwierigkeitsgrad: Jede Aufgabe hat einstellbare Schwierigkeitsparameter
  • Zwei Versionen: einfache Version (für Modell 7B) und schwierige Version (für Modell 32B)

Datensatzkonfiguration

SynLogic-Easy

  • Ziel: 7B-Parametermodell
  • Aufgabe: 27 Missionen
  • Probe: Etwa 16.000 Trainingsinstanzen

SynLogic-Hard

  • Ziel: 32B-Parametermodell
  • Aufgabe: Alle 35 Aufgaben
  • Probe: Etwa 33.000 Trainingsinstanzen
SynLogic.torrent
Seeding 1Herunterladen 0Abgeschlossen 26Gesamtdownloads 76
  • SynLogic/
    • README.md
      1.79 KB
    • README.txt
      3.58 KB
      • data/
        • SynLogic.zip
          50.49 MB