HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات SFT الموجهة للضبط الدقيق المُشرف عليها PromptCoT-2.0-SFT-4.8M

التاريخ

منذ 4 أشهر

الحجم

21.79 GB

المؤسسة

جامعة هونغ كونغ
مجموعة النمل

رابط الورقة البحثية

2509.19894

الترخيص

MIT

PromptCoT-2.0-SFT-4.8M هي مجموعة بيانات سريعة اصطناعية واسعة النطاق أصدرها فريق البحث في جامعة هونج كونج ومجموعة Ant في عام 2025. نتائج الورقة ذات الصلة هي "PromptCoT 2.0: توسيع نطاق تركيب المطالبات لاستدلال نموذج اللغة الكبير"، والذي يهدف إلى توفير مجموعة من الأدلة الاستدلالية عالية الجودة لنماذج اللغة الكبيرة من أجل الضبط الدقيق أو التدريب الذاتي.

تحتوي مجموعة البيانات على ما يقرب من 4.8 مليون مطالبة اصطناعية بالكامل مع مسارات استدلال في كل من سيناريوهات الضبط الدقيق الخاضعة للإشراف وسيناريوهات الممارسة الذاتية، وتغطي منطقتين رئيسيتين للاستدلال: الرياضيات والبرمجة.

تكوين البيانات:

  • في سيناريو الضبط الدقيق الخاضع للإشراف (SFT)، تم تجميع إجمالي 4,766,890 مطالبة، بما في ذلك:
    • 1,188,505 مطالبة بمهام البرمجة
    • 3,578,385 سؤالًا في الرياضيات

PromptCoT-2.0-SFT-4.8M.torrent
البذر 1جارٍ التنزيل 0مكتمل 34إجمالي التنزيلات 99
  • PromptCoT-2.0-SFT-4.8M/
    • README.md
      1.53 KB
    • README.txt
      3.06 KB
      • data/
        • PromptCoT-2.0-SFT-4.8M.zip
          21.79 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp