HyperAI

نشر DeepSeek R1 باستخدام Ollama و Open WebUI

1. مقدمة البرنامج التعليمي

DeepSeek-R1 هو الإصدار الأول من سلسلة نماذج اللغة التي أطلقتها DeepSeek في عام 2025، مع التركيز على مهام معالجة اللغة الطبيعية الفعالة والخفيفة الوزن. تم تحسين هذه العائلة من النماذج من خلال تقنيات متقدمة، مثل تقطير المعرفة، بهدف تقليل متطلبات موارد الحوسبة مع الحفاظ على الأداء العالي. تم تصميم DeepSeek-R1 مع التركيز على سيناريوهات التطبيق العملي، ويدعم النشر السريع والتكامل، وهو مناسب لمجموعة متنوعة من المهام، بما في ذلك إنشاء النصوص، وأنظمة الحوار، والترجمة، وإنشاء الملخصات.

على المستوى التقني، يستخدم DeepSeek-R1 تقنية تقطير المعرفة لاستخراج المعرفة من النماذج الكبيرة لتدريب النماذج الأصغر ذات الأداء المماثل. وفي الوقت نفسه، تعمل خوارزميات التدريب والتحسين الموزعة الفعالة على تقصير وقت التدريب بشكل أكبر وتحسين كفاءة تطوير النموذج. وتسمح هذه المزايا التقنية لـ DeepSeek-R1 بأداء جيد في التطبيقات العملية.

本教程预设 DeepSeek-R1-Distill-Qwen-1.5B 、 DeepSeek-R1-Distill-Qwen-7B 、 DeepSeek-R1-Distill-Qwen-8B 、 DeepSeek-R1-Distill-Qwen-32B 四种模型作为演示,算力资源采用「单卡 RTX4090」。

2. خطوات التشغيل

  1. بعد استنساخ الحاوية وبدء تشغيلها، انقر على عنوان API للدخول إلى واجهة الويب (إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة 5 دقائق تقريبًا ثم المحاولة مرة أخرى).

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

يلاحظ:

  • يدعم هذا البرنامج التعليمي "البحث عبر الإنترنت". بعد تشغيل هذه الوظيفة، سوف تتباطأ سرعة التفكير، وهو أمر طبيعي.
  • يمكنك تبديل النماذج في الزاوية اليسرى العليا للواجهة.
تقوم شركة Ollama+Open-Webui بنشر DeekSeek-R1

إعدادات المحادثة الشائعة

1. درجة الحرارة

  • يتحكم في عشوائية الإخراج، وعادةً ما يكون ذلك في نطاق 0.0-2.0  بين.
  • قيمة منخفضة (مثل 0.1):أكثر يقينًا، متحيزًا نحو الكلمات الشائعة.
  • قيمة عالية (مثل 1.5):محتوى أكثر عشوائية، وربما أكثر إبداعًا ولكنه غير منتظم.

2. أخذ العينات من أعلى إلى أسفل

  • فقط من  k مع أعلى احتمال  أخذ العينات بالكلمات، باستثناء الكلمات ذات الاحتمالية المنخفضة.
  • k صغير (على سبيل المثال 10):مزيد من اليقين، وأقل عشوائية.
  • k كبير (على سبيل المثال 50):مزيد من التنوع، ومزيد من الابتكار.

3. أخذ العينات من أعلى p (أخذ العينات من النواة، أخذ العينات من أعلى p)

  • يختارمجموعة الكلمات ذات الاحتمال التراكمي الذي يصل إلى p, قيمة k ليست ثابتة.
  • قيمة منخفضة (مثل 0.3):مزيد من اليقين، وأقل عشوائية.
  • قيمة عالية (مثل 0.9):مزيد من التنوع، وتحسين الطلاقة.

4. عقوبة التكرار

  • يتحكم في تكرار النص، عادةً في 1.0-2.0  بين.
  • قيمة عالية (مثل 1.5):تقليل التكرار وتحسين قابلية القراءة.
  • قيمة منخفضة (مثل 1.0):لا توجد عقوبة، قد يتسبب ذلك في تكرار النموذج للكلمات والجمل.

5. الحد الأقصى للرموز (الحد الأقصى لطول الجيل)

  • نموذج التقييدالحد الأقصى لعدد الرموز المولدةلتجنب الإخراج الطويل للغاية.
  • النطاق النموذجي:50-4096(يعتمد على النموذج المحدد).

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓