HyperAIHyperAI

مجموعة بيانات SFT الموجهة للضبط الدقيق المُشرف عليها PromptCoT-2.0-SFT-4.8M

التاريخ

منذ 6 أيام

المؤسسة

جامعة هونغ كونغ
مجموعة النمل

رابط النشر

huggingface.co

رابط الورقة البحثية

2509.19894

الترخيص

MIT

مساعدة التنزيل

PromptCoT-2.0-SFT-4.8M هي مجموعة بيانات سريعة اصطناعية واسعة النطاق أصدرها فريق البحث في جامعة هونج كونج ومجموعة Ant في عام 2025. نتائج الورقة ذات الصلة هي "PromptCoT 2.0: توسيع نطاق تركيب المطالبات لاستدلال نموذج اللغة الكبير"، والذي يهدف إلى توفير مجموعة من الأدلة الاستدلالية عالية الجودة لنماذج اللغة الكبيرة من أجل الضبط الدقيق أو التدريب الذاتي.

تحتوي مجموعة البيانات على ما يقرب من 4.8 مليون مطالبة اصطناعية بالكامل مع مسارات استدلال في كل من سيناريوهات الضبط الدقيق الخاضعة للإشراف وسيناريوهات الممارسة الذاتية، وتغطي منطقتين رئيسيتين للاستدلال: الرياضيات والبرمجة.

تكوين البيانات:

  • في سيناريو الضبط الدقيق الخاضع للإشراف (SFT)، تم تجميع إجمالي 4,766,890 مطالبة، بما في ذلك:
    • 1,188,505 مطالبة بمهام البرمجة
    • 3,578,385 سؤالًا في الرياضيات