HyperAI

نشر DeepSeek-R1-70B بنقرة واحدة

1. مقدمة البرنامج التعليمي

DeepSeek-R1-Distill-Llama-70B هو نموذج لغوي كبير مفتوح المصدر أطلقته DeepSeek في عام 2025، بمقياس معلمات يصل إلى 70 مليار. يتم تدريبه على أساس Llama3.3-70B-Instruct، ويستخدم التعلم التعزيزي وتكنولوجيا التقطير لتحسين أداء التفكير. فهو لا يرث مزايا نماذج سلسلة Llama فحسب، بل يعمل أيضًا على تحسين القدرة على التفكير على هذا الأساس، وخاصة في مهام الرياضيات والترميز والتفكير المنطقي. باعتباره إصدارًا عالي الأداء من سلسلة DeepSeek، فهو يعمل بشكل جيد في معايير متعددة. بالإضافة إلى ذلك، يعد هذا النموذج نموذجًا معززًا بالاستدلال تقدمه DeepSeek AI، والذي يدعم سيناريوهات تطبيق متعددة، مثل الأجهزة المحمولة والحوسبة الحافة وخدمات الاستدلال عبر الإنترنت، وما إلى ذلك، لتحسين سرعة الاستجابة وتقليل تكاليف التشغيل. فهو يمتلك قدرات قوية جدًا في التفكير واتخاذ القرار. في مجالات مساعدي الذكاء الاصطناعي المتقدمين وتحليل الأبحاث العلمية وما إلى ذلك، يمكنه تقديم نتائج تحليلية احترافية ومتعمقة للغاية. على سبيل المثال، في مجال البحث الطبي، يمكن للإصدار 70B تحليل كميات كبيرة من البيانات الطبية وتوفير مرجع قيم لأبحاث الأمراض.

本教程使用 Ollama + Open WebUI 部署 DeepSeek-R1-Distill-Qwen-70B 作为演示,算力资源采用「单卡 A6000」。

2. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر على عنوان API للدخول إلى واجهة الويب (إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار حوالي 5 دقائق ثم المحاولة مرة أخرى). 2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج!

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

Ollama + Open WebUI Deployment DeekSeek-R1-70B

إعدادات المحادثة الشائعة

1. درجة الحرارة

  • يتحكم في عشوائية الإخراج، وعادةً ما يكون ذلك في نطاق 0.0-2.0  بين.
  • قيمة منخفضة (مثل 0.1):أكثر يقينًا، متحيزًا نحو الكلمات الشائعة.
  • قيمة عالية (مثل 1.5):محتوى أكثر عشوائية، وربما أكثر إبداعًا ولكنه غير منتظم.

2. أخذ العينات من أعلى إلى أسفل

  • فقط من  k مع أعلى احتمال  أخذ العينات بالكلمات، باستثناء الكلمات ذات الاحتمالية المنخفضة.
  • k صغير (على سبيل المثال 10):مزيد من اليقين، وأقل عشوائية.
  • k كبير (على سبيل المثال 50):مزيد من التنوع، ومزيد من الابتكار.

3. أخذ العينات من أعلى p (أخذ العينات من النواة، أخذ العينات من أعلى p)

  • يختارمجموعة الكلمات ذات الاحتمال التراكمي الذي يصل إلى p, قيمة k ليست ثابتة.
  • قيمة منخفضة (مثل 0.3):مزيد من اليقين، وأقل عشوائية.
  • قيمة عالية (مثل 0.9):مزيد من التنوع، وتحسين الطلاقة.

4. عقوبة التكرار

  • يتحكم في تكرار النص، عادةً في 1.0-2.0  بين.
  • قيمة عالية (مثل 1.5):تقليل التكرار وتحسين قابلية القراءة.
  • قيمة منخفضة (مثل 1.0):لا توجد عقوبة، قد يتسبب ذلك في تكرار النموذج للكلمات والجمل.

5. الحد الأقصى للرموز (الحد الأقصى لطول الجيل)

  • نموذج التقييدالحد الأقصى لعدد الرموز المولدةلتجنب الإخراج الطويل للغاية.
  • النطاق النموذجي:50-4096(يعتمد على النموذج المحدد).

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓