HyperAI

نشر vLLM + Open WebUI MiniCPM4-8B

1. مقدمة البرنامج التعليمي

نجوم جيثب

MiniCPM 4.0 هو نموذج لغة كبير (LLM) فعال من الطرف النهائي، أطلقته OpenBMB في 6 يونيو 2025. بفضل تقنيات مثل البنية المتفرقة، وضغط التكميم، وإطار عمل استدلالي فعال، يحقق هذا النموذج استدلالًا عالي الأداء بتكلفة حوسبة منخفضة، وهو مناسب بشكل خاص لمعالجة النصوص الطويلة، والسيناريوهات الحساسة للخصوصية، ونشر أجهزة الحوسبة الطرفية. يُظهر MiniCPM4-8B سرعة معالجة أسرع بكثير من Qwen3-8B عند معالجة التسلسلات الطويلة. نتائج البحث ذات الصلة هي:MiniCPM4: برامج إدارة التعلم عالية الكفاءة على الأجهزة الطرفية".

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

إذا لم يظهر "النموذج"، فهذا يعني أنه قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

كيفية الاستخدام

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

شكرًا لمستخدم Github xxxجججج1  نشر هذا البرنامج التعليمي. معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{minicpm4,
  title={MiniCPM4: Ultra-Efficient LLMs on End Devices},
  author={MiniCPM Team},
  year={2025}
}

@inproceedings{huminicpm,
  title={MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies},
  author={Hu, Shengding and Tu, Yuge and Han, Xu and Cui, Ganqu and He, Chaoqun and Zhao, Weilin and Long, Xiang and Zheng, Zhi and Fang, Yewei and Huang, Yuxiang and others},
  booktitle={First Conference on Language Modeling},
  year={2024}
}