التاريخ

منذ عام واحد

الحجم

8.08 GB

عنوان URL للنشر

الوسوم

MiniMind هو مشروع نموذج لغة كبير خفيف الوزن مفتوح المصدر يهدف إلى خفض عتبة استخدام نماذج اللغة الكبيرة (LLM) وتمكين المستخدمين الفرديين من التدريب والاستنتاج بسرعة على الأجهزة العادية. يحتوي MiniMind على مجموعات بيانات متعددة، مثل مجموعة تدريب tokenizer لتدريب مجزئ الكلمات، وبيانات Pretrain لتدريب النموذج مسبقًا، وبيانات SFT للضبط الدقيق الخاضع للإشراف، وبيانات DPO 1 وبيانات DPO 2 لتدريب نموذج المكافأة. تم دمج مجموعات البيانات هذه من مصادر مختلفة، مثل بيانات SFT من Jiangshu Technology، وبيانات Qwen2.5 المقطرة، وما إلى ذلك، بإجمالي يبلغ حوالي 3 مليارات رمز، وهي مناسبة للتدريب المسبق لنماذج اللغة الصينية الكبيرة.

minimind_dataset.torrent

البذر 1جارٍ التنزيل 0مكتمل 129إجمالي التنزيلات 249

minimind_dataset/
- README.md
  1.31 KB
- README.txt
  2.63 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار