نشر DeepCoder-14B-Preview بنقرة واحدة
1. مقدمة البرنامج التعليمي
مشروع DeepCoder-14B-Preview هو نموذج ترميز 14B تم إصداره بواسطة AGENTICA في 8 أبريل 2025. تم ضبط النموذج بدقة من DeepSeek-R1-Distilled-Qwen-14B LLM من أجل استدلال الكود، ويتناسب مع أطوال السياق الطويلة باستخدام التعلم التعزيزي التوزيعي (RL). يحقق النموذج دقة Pass@1 تبلغ 60.6% على LiveCodeBench v5 (8/1/24-2/1/25)، وهو تحسن قدره 8% مقارنة بالنموذج الأساسي (53%)، ويحقق أداءً مشابهًا لـ o3-mini من OpenAI مع 14B معلمة فقط.
يستخدم هذا البرنامج التعليمي نموذج DeepCoder-14B-Preview كحالة توضيحية ويتبنى طريقة التكميم المكونة من 8 بتات التي توفرها bitsandbytes لتحسين استخدام ذاكرة الفيديو. تجدر الإشارة إلى أن طريقة التكميم هذه قد يكون لها تأثير معين على أداء النموذج. مصدر قوة الحوسبة المستخدم هو RTX4090.
2. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. يرجى الانتظار لمدة 1-2 دقيقة ثم قم بتحديث الصفحة.

2. العرض التوضيحي الوظيفي

إذا ظهرت رسالة "خطأ: HTTPConnectionPool(host="localhost, port=8000): تم تجاوز الحد الأقصى لعدد مرات إعادة المحاولة مع عنوان url: /v1/completions" كما هو موضح أدناه، فهذا يعني أن النموذج قيد التهيئة. يُرجى الانتظار لمدة دقيقة أو دقيقتين تقريبًا ثم تحديث الصفحة.

معلومات الاستشهاد
شكرًا لمستخدم GitHub سوبر يانغ لإنتاج هذا البرنامج التعليمي، معلومات مرجعية للمشروع هي كما يلي:
@misc{deepcoder2025,
title={DeepCoder: A Fully Open-Source 14B Coder at O3-mini Level},
author={Michael Luo, Sijun Tan, Roy Huang, Xiaoxiang Shi, Rachel Xin, Colin Cai, Ameen Patel, Alpay Ariyak, Qingyang Wu, Ce Zhang, Li Erran Li, Raluca Ada Popa, Ion Stoica},
howpublished={\url{https://pretty-radio-b75.notion.site/DeepCoder-A-Fully-Open-Source-14B-Coder-at-O3-mini-Level-1cf81902c14680b3bee5eb349a512a51}},
note={Notion Blog},
year={2025}
}
@misc{deepscaler2025,
title={DeepScaleR: Surpassing O1-Preview with a 1.5B Model by Scaling RL},
author={Michael Luo and Sijun Tan and Justin Wong and Xiaoxiang Shi and William Y. Tang and Manan Roongta and Colin Cai and Jeffrey Luo and Li Erran Li and Raluca Ada Popa and Ion Stoica},
year={2025},
howpublished={\url{https://pretty-radio-b75.notion.site/DeepScaleR-Surpassing-O1-Preview-with-a-1-5B-Model-by-Scaling-RL-19681902c1468005bed8ca303013a4e2}},
note={Notion Blog}
year={2025}
}
التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
