مجموعة بيانات الاستدلال SynLogic
SynLogic هي مجموعة بيانات شاملة للاستدلال المنطقي التركيبي، صدرت عام ٢٠٢٥ من قِبل جامعة هونغ كونغ للعلوم والتكنولوجيا وفريق أبحاث MiniMax. نتائج البحث ذات الصلة هي:SynLogic: تجميع بيانات الاستدلال القابلة للتحقق على نطاق واسع لتعلم الاستدلال المنطقي وما بعده"، والذي يهدف إلى تعزيز قدرة التفكير المنطقي لنماذج اللغة الكبيرة (LLMs) من خلال التعلم التعزيزي مع المكافآت القابلة للتحقق.
تحتوي مجموعة البيانات على 35 مهمة تفكير منطقي متنوعة وتتمتع بقدرات التحقق التلقائي، مما يجعلها مناسبة تمامًا لتدريب التعلم التعزيزي.
الميزات الرئيسية
- 35 نوعًا من المهام: بما في ذلك السودوكو، والألعاب المكونة من 24 نقطة، وكلمات المرور، ومتاهات الأسهم، والألغاز الحسابية، وما إلى ذلك.
- مكافأة قابلة للتحقق: جميع العينات لديها متحقق تلقائي للتحقق من صحتها
- صعوبة قابلة للتحكم: كل مهمة لها معلمات صعوبة قابلة للتعديل
- نسختان: نسخة سهلة (لطراز 7B) ونسخة صعبة (لطراز 32B)
تكوين مجموعة البيانات
- هدف:نموذج المعلمة 7 ب
- مهمة: 27 مهمة
- عينة:حوالي 16000 حالة تدريب
- هدف:نموذج المعلمة 32B
- مهمة:جميع المهام الـ 35
- عينة:حوالي 33000 حالة تدريب