مجموعة بيانات الاستدلال واسعة النطاق GeneralThought-430K
التاريخ
الحجم
رابط النشر
GeneralThought-430K هي مجموعة بيانات استدلالية واسعة النطاق أصدرها فريق General Reasoning في عام 2025. وتهدف إلى توفير موارد موحدة لتدريب وتقييم الاستدلال المنطقي وتكامل المعرفة متعددة التخصصات وقدرات حل المشكلات المعقدة للنماذج اللغوية الكبيرة.
تحتوي مجموعة البيانات على 430,000 عينة، تغطي مسائل في مجالات الرياضيات، والبرمجة، والفيزياء، والكيمياء، والعلوم الطبيعية، والعلوم الإنسانية والاجتماعية، وتكنولوجيا الهندسة، وغيرها. تتضمن أسئلةً، وإجاباتٍ مرجعية، ومساراتٍ منطقية، وإجاباتٍ نهائية، وبياناتٍ وصفية أخرى من نماذج منطقية متعددة، بما في ذلك DeepSeek-R1، وDeepSeek-R1-Zero، وOpenThoughts-32B، وLIMO، وغيرها من النماذج السائدة. كما أُدرجت الإجابات النهائية لـ o3-mini-2025-01-31، وgemini-2-flash-thinking-exp-01-21، وclaude-3-7-sonnet-20250219 للمقارنة والتقييم.