DeepSeek V4 يبنى على NVIDIA Blackwell
أطلقت شركة DeepSeek الجيل الرابع من نماذجها الرائدة، وهي DeepSeek-V4-Pro وDeepSeek-V4-Flash، وذلك لدعم عمليات الاستدلال بكفاءة عالية لنصوص طويلة تصل إلى مليون رمز. يهدف النموذان إلى تمكين تطبيقات الذكاء الاصطناعي المعقدة التي تتطلب معالجة سياقات ضخمة، مثل تحليل المستندات الطويلة والبرمجة المتقدمة وأنظمة الوكلاء الذكيين. يُعد نموذج V4-Pro الأكبر في العائلة، حيث يحتوي على 1.6 تريليون معلمة إجمالية، مع 49 مليار معلمة نشطة تعمل أثناء التنفيذ. بينما يُصمم نموذج V4-Flash الأصغر بحجم 284 مليار معلمة و13 مليار معلمة نشطة، ليكون الخيار الأمثل للمهام التي تتطلب سرعة وكفاءة عالية. يجمع النموذان بين واجهات متعددة الوسائط للنص فقط، مع دعم نافذة سياق تصل إلى مليون رمز وطول مخرجات يصل إلى 384 ألف رمز عبر واجهة برمجة التطبيقات. يتميز كلا النموذجين بتصريح ترخيص مفتوح المصدر (MIT)، مما يسمح باستخدامه بحرية في المشاريع التجارية والعلمية. تعتمد بنية هذه النماذج على تطور هندسة MoE (المختبرات الخاصة بالمرشحات) مع تحسينات جوهرية في آلية الانتباه (Attention). تساهم هذه الابتكارات المعمارية، وتحديدًا دمج تقنيات CSA وDSA وHCA في ما يسمى بالانتباه الهجين، في تقليل تكلفة العمليات الحسابية لكل رمز بنسبة 73%، وخفض عبء ذاكرة التخزين المؤقت (KV Cache) بنسبة 90% مقارنة بالإصدار السابق V3. هذا التحسين ضروري لأن تطبيقات الوكلاء الحديثة تتطلب تخزين كميات هائلة من البيانات مثل تعليمات النظام ومخرجات الأدوات وسجلات العمليات ومسارات التفكير المتعددة الخطوات في نافذة سياقية واحدة. تعتبر منصة NVIDIA Blackwell حلاً مثالياً لتشغيل هذه النماذج الضخمة، حيث أثبتت اختبارات أداء حقيقية على معادلات GB200 NVL72 قدرة عالية في معالجة نموذج V4-Pro، محققة أكثر من 150 رمزًا في الثانية لكل مستخدم في سيناريوهات نصوص قصيرة وطويلة. توفر المنصة البنية التحتية اللازمة للتحول من مجرد محادثات نصية بسيطة إلى أنظمة استدلال معقدة طويلة المدى. يمكن للمطورين البدء في بناء تطبيقاتهم باستخدام واجهات NVIDIA المعجزة بالرسوميات (GPU-accelerated endpoints) المتوفرة على منصة NVIDIA Developer، وهي تقدم طريقة سريعة للتجربة قبل الانتقال إلى النشر الذاتي. كما يتوفر النموذج للتنزيل فور إطلاقه عبر NVIDIA NIM، مما يسهل تكامله مع الأنظمة القائمة باستخدام أنماط واجهة برمجة التطبيقات المألوفة. تدعم أدوات مثل SGLang وvLLM نماذج DeepSeek-V4 بمصفوفات تشغيلية مخصصة لكل من منصات Blackwell وHopper، مع خيارات لتحسين زمن الاستجابة أو زيادة الإنتاجية أو التعامل مع السياقات الطويلة عبر فصل مراحل المعالجة. يركز الذكاء الاصطناعي في هذه المرحلة على تحويل البنية التحتية، حيث يتحول التركيز من مجرد اختيار النموذج إلى استراتيجية البنية التحتية القادرة على نشر هذه النماذج بأقل تكلفة لكل رمز. تتيح NVIDIA مجموعة واسعة من الخيارات بدءًا من نشرات مراكز البيانات باستخدام Blackwell، وصولاً إلى خدمات الميكروservices المدارة عبر NIM وأدوات ضبط النماذج. تؤكد الشركة التزامها بالنظام البيئي مفتوح المصدر وتساهم بأحدث المشاريع لتحسين السلامة والأمان في أنظمة الذكاء الاصطناعي. يمكن للمطورين الوصول إلى النماذج وتجربتها مباشرة عبر منصات مثل Hugging Face أو واجهات بناء NVIDIA.
