S1k-datensatz Zum Schlussfolgerungsproblem
Datum
Größe
Veröffentlichungs-URL
Kategorien
*Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.
Der s1K-Datensatz ist ein hochwertiger Reasoning-Datensatz, der 2025 vom Team um Fei-Fei Li veröffentlicht wurde. Er enthält 1.000 Fragen und deren detaillierte Reasoning-Trajektorien und Antworten, die aus den Destillationsergebnissen des Gemini Thinking-Experiments von Google abgeleitet sind. Der Datensatz deckt 50 verschiedene Bereiche ab, darunter Wahrscheinlichkeitstheorie, quantitative Interviewfragen und Olympiadenfragen, und stellt sicher, dass das Modell verschiedene Arten von Denkaufgaben bewältigen kann. Die relevanten Papierergebnisse sinds1: Einfache Testzeitskalierung".
Der Datensatz ist so konzipiert, dass er durch minimale Datentechnik eine effiziente Feinabstimmung des Modells ermöglicht und bei Inferenzaufgaben eine hervorragende Leistung zeigt.