GeneralThought-430K-Datensatz Zum Groß Angelegten Denken
Datum
Größe
Veröffentlichungs-URL
Kategorien
GeneralThought-430K ist ein umfangreicher Datensatz zum logischen Denken, der 2025 vom General Reasoning-Team veröffentlicht wurde. Ziel ist es, standardisierte Ressourcen für das Training und die Bewertung des logischen Denkens, der interdisziplinären Wissensintegration und der komplexen Problemlösungsfähigkeiten großer Sprachmodelle bereitzustellen.
Der Datensatz enthält 430.000 Beispiele und deckt Probleme aus den Bereichen Mathematik, Programmierung, Physik, Chemie, Naturwissenschaften, Geistes- und Sozialwissenschaften, Ingenieurtechnik usw. ab. Er umfasst Fragen, Referenzantworten, Denkpfade, endgültige Antworten und weitere Metadaten aus verschiedenen Denkmodellen, darunter DeepSeek-R1, DeepSeek-R1-Zero, OpenThoughts-32B, LIMO und andere gängige Modelle. Die endgültigen Antworten von o3-mini-2025-01-31, gemini-2-flash-thinking-exp-01-21 und claude-3-7-sonnet-20250219 sind ebenfalls zum Vergleich und zur Bewertung enthalten.