HyperAIHyperAI

vLLM + Open WebUI نشر NVIDIA-Nemotron-Nano-9B-v2

1. مقدمة البرنامج التعليمي

NVIDIA-Nemotron-Nano-9B-v2 هو نموذج خفيف الوزن لغوي كبير، أطلقه فريق NVIDIA في 19 أغسطس 2025. وباعتباره نسخة مُحسّنة من سلسلة Nemotron، يجمع هذا النموذج بشكل مبتكر بين كفاءة معالجة التسلسلات الطويلة في Mamba وقدرات النمذجة الدلالية القوية في Transformer، محققًا دعمًا لسياقات فائقة الطول يصل إلى 128 ألفًا باستخدام 9 مليارات معلمة فقط (9 مليار). تُضاهي كفاءة الاستدلال وأداء المهام على أجهزة الحوسبة الطرفية (مثل وحدات معالجة الرسومات من فئة RTX 4090) النماذج المتطورة بنفس مقياس المعلمات، مما يُمثل إنجازًا كبيرًا في مجال النشر خفيف الوزن وفهم النصوص الطويلة لنماذج اللغات الكبيرة. نتائج البحث ذات الصلة هي:NVIDIA Nemotron Nano 2: نموذج استدلالي دقيق وفعال لمحول مامبا الهجين".

يستخدم هذا البرنامج التعليمي بطاقة RTX A6000 واحدة كمورد.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

إذا لم يظهر "النموذج"، فهذا يعني أنه قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

كيفية الاستخدام

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{nvidia2025nvidianemotronnano2,
      title={NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model},
      author={NVIDIA},
      year={2025},
      eprint={2508.14444},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2508.14444},
}

vLLM + Open WebUI نشر NVIDIA-Nemotron-Nano-9B-v2 | الدروس | HyperAI