HyperAI

SynLogic-Inferenzdatensatz

Datum

vor 6 Tagen

Organisation

Veröffentlichungs-URL

huggingface.co

Kategorien

Download-Hilfe

SynLogic ist ein umfassender synthetischer Logik-Datensatz, der 2025 von der Hong Kong University of Science and Technology und dem MiniMax-Forschungsteam veröffentlicht wurde. Die zugehörigen Ergebnisse sind:SynLogic: Synthese verifizierbarer Schlussfolgerungsdaten im großen Maßstab zum Erlernen logischen Denkens und darüber hinaus", dessen Ziel darin besteht, die Fähigkeit zum logischen Denken großer Sprachmodelle (LLMs) durch bestärkendes Lernen mit überprüfbaren Belohnungen zu verbessern.

Der Datensatz enthält 35 verschiedene Aufgaben zum logischen Denken und verfügt über automatische Validierungsfunktionen, sodass er sich gut für das Training mit bestärkendem Lernen eignet.

Hauptmerkmale

  • 35 Aufgabentypen: darunter Sudoku, 24-Punkte-Spiele, Passwörter, Pfeillabyrinthe, Rechenrätsel usw.
  • Verifizierbarer Bonus: Alle Proben verfügen über einen automatischen Verifizierer zur Richtigkeitsprüfung
  • Steuerbarer Schwierigkeitsgrad: Jede Aufgabe hat einstellbare Schwierigkeitsparameter
  • Zwei Versionen: einfache Version (für Modell 7B) und schwierige Version (für Modell 32B)

Datensatzkonfiguration

SynLogic-Easy

  • Ziel: 7B-Parametermodell
  • Aufgabe: 27 Missionen
  • Probe: Etwa 16.000 Trainingsinstanzen

SynLogic-Hard

  • Ziel: 32B-Parametermodell
  • Aufgabe: Alle 35 Aufgaben
  • Probe: Etwa 33.000 Trainingsinstanzen