مجموعة بيانات التفكير المختلط
التاريخ
منذ شهر واحد
الحجم
5.05 GB
رابط النشر
العلامات
مزيج الأفكار عبارة عن مجموعة بيانات استدلالية متعددة المجالات تدمج مسارات الاستدلال عالية الجودة في ثلاثة مجالات رئيسية: الرياضيات والبرمجة والعلوم. ويهدف إلى تدريب نموذج لغوي كبير (LLM) لأداء التفكير خطوة بخطوة. تحتوي كل عينة في مجموعة البيانات هذه على messages
الحقل الذي يخزن عملية التفكير في شكل جولات متعددة من الحوار (مثل: السؤال → خطوات التفكير → الإجابة)، ويدعم قدرة النموذج على تعلم الاستنتاج خطوة بخطوة.
هيكل مجموعة البيانات:
- الرياضيات: 93.7 ألف تتبع لحل مسائل الرياضيات
- البرمجة: 83.1 ألف مسار استدلالي لمشاكل البرمجة التنافسية في Python وC++
- العلوم: 173 ألف مسار استدلالي للأسئلة العلمية
Mixture-of-Thoughts.torrent
البذر 1التنزيل 0مكتمل 7إجمالي التنزيلات 17