SynLogic-Inferenzdatensatz
Datum
vor 6 Tagen
Veröffentlichungs-URL
Kategorien
SynLogic ist ein umfassender synthetischer Logik-Datensatz, der 2025 von der Hong Kong University of Science and Technology und dem MiniMax-Forschungsteam veröffentlicht wurde. Die zugehörigen Ergebnisse sind:SynLogic: Synthese verifizierbarer Schlussfolgerungsdaten im großen Maßstab zum Erlernen logischen Denkens und darüber hinaus", dessen Ziel darin besteht, die Fähigkeit zum logischen Denken großer Sprachmodelle (LLMs) durch bestärkendes Lernen mit überprüfbaren Belohnungen zu verbessern.
Der Datensatz enthält 35 verschiedene Aufgaben zum logischen Denken und verfügt über automatische Validierungsfunktionen, sodass er sich gut für das Training mit bestärkendem Lernen eignet.
Hauptmerkmale
- 35 Aufgabentypen: darunter Sudoku, 24-Punkte-Spiele, Passwörter, Pfeillabyrinthe, Rechenrätsel usw.
- Verifizierbarer Bonus: Alle Proben verfügen über einen automatischen Verifizierer zur Richtigkeitsprüfung
- Steuerbarer Schwierigkeitsgrad: Jede Aufgabe hat einstellbare Schwierigkeitsparameter
- Zwei Versionen: einfache Version (für Modell 7B) und schwierige Version (für Modell 32B)
Datensatzkonfiguration
- Ziel: 7B-Parametermodell
- Aufgabe: 27 Missionen
- Probe: Etwa 16.000 Trainingsinstanzen
- Ziel: 32B-Parametermodell
- Aufgabe: Alle 35 Aufgaben
- Probe: Etwa 33.000 Trainingsinstanzen