مجموعة بيانات SFT الموجهة للضبط الدقيق المُشرف عليها PromptCoT-2.0-SFT-4.8M
التاريخ
منذ 6 أيام
رابط النشر
رابط الورقة البحثية
الترخيص
MIT
العلامات
PromptCoT-2.0-SFT-4.8M هي مجموعة بيانات سريعة اصطناعية واسعة النطاق أصدرها فريق البحث في جامعة هونج كونج ومجموعة Ant في عام 2025. نتائج الورقة ذات الصلة هي "PromptCoT 2.0: توسيع نطاق تركيب المطالبات لاستدلال نموذج اللغة الكبير"، والذي يهدف إلى توفير مجموعة من الأدلة الاستدلالية عالية الجودة لنماذج اللغة الكبيرة من أجل الضبط الدقيق أو التدريب الذاتي.
تحتوي مجموعة البيانات على ما يقرب من 4.8 مليون مطالبة اصطناعية بالكامل مع مسارات استدلال في كل من سيناريوهات الضبط الدقيق الخاضعة للإشراف وسيناريوهات الممارسة الذاتية، وتغطي منطقتين رئيسيتين للاستدلال: الرياضيات والبرمجة.
تكوين البيانات:
- في سيناريو الضبط الدقيق الخاضع للإشراف (SFT)، تم تجميع إجمالي 4,766,890 مطالبة، بما في ذلك:
- 1,188,505 مطالبة بمهام البرمجة
- 3,578,385 سؤالًا في الرياضيات