DeepSeek تنشر طريقة تدريب جديدة لتسهيل توسيع نماذج الذكاء الاصطناعي الكبيرة
أعلنت شركة ديب سيك الصينية،startup رائدة في مجال الذكاء الاصطناعي، عن طريقة تدريب جديدة لنموذج اللغة الكبيرة (LLM) تُسمى "الاتصالات الزائدة المقيدة بالمنطقة" أو mHC، والتي تُعدّ خطوة متقدمة في تطوير النماذج الأساسية. ونشرت الشركة بحثًا علميًا بقيادة مؤسسها ليانغ وينفونغ، يُقدّم هذه الطريقة كحل مبتكر لمشكلة التوسع في النماذج الكبيرة، حيث تُعدّ التحديات المتعلقة بالاستقرار والكفاءة الحسابية من العوائق الرئيسية عند زيادة حجم النماذج. الأساس في المنهج الجديد يكمن في السماح للنماذج بتبادل معلومات داخلية أكثر غنى، ولكن ضمن قيود محددة تُحافظ على استقرار التدريب وتجنب التدهور الأداء، حتى عند التوسع الكبير. وفقًا للبحث، فإن التوسع التقليدي في النماذج يُفضي غالبًا إلى تداخل غير متحكم فيه في المعلومات، ما يُضعف الأداء أو يُسبب فشل التدريب. أما mHC، فيُعدّ نموذجًا مُعاد تصميمه من الصفر، يُقلّل من التكاليف الإضافية المرتبطة بالتدريب، مع الحفاظ على كفاءة عالية. أكد وِي سون، المحللة الرئيسية في مجال الذكاء الاصطناعي بشركة كاونتيربوينت ريسيرش، أن هذه الطريقة تمثل "انفجارًا مفاجئًا" في مجال تطوير النماذج، مشيرة إلى أن ديب سيك نجحت في دمج تقنيات متعددة لتجاوز عقبات الحوسبة، حتى مع ارتفاع طفيف في التكلفة. واعتبرت أن البحث يعكس قدرات داخلية قوية، ويشير إلى قدرة الشركة على تجريب أفكار غير تقليدية بسرعة. من جهته، أشار ليان جي سو، الخبير في شركة أومديا، إلى أن نشر هذا البحث قد يُحدث تأثيرًا واسعًا في الصناعة، حيث من المرجح أن تُقلّد مختبرات الذكاء الاصطناعي المنافسة هذا النهج. واعتبر أن مشاركة ديب سيك لنتائجها يُعدّ استراتيجية مُحَسَّنة، تُظهر ثقة متزايدة في القدرات التكنولوجية للصناعة الصينية. يأتي هذا الإعلان في سياق توقّعات بصدور نموذج جديد من ديب سيك، يُعرف بـ R2، الذي تأجل إطلاقه من مُنتصف 2025 بسبب رغبة ليانغ في تحسين الأداء، فضلًا عن نقص في الرقائق المتطورة، وهو عائق شائع في مختبرات الذكاء الاصطناعي الصينية. ورغم أن البحث لا يذكر R2 صراحة، فإن تزامن نشره مع تطورات مُتوقعة يثير التساؤلات حول احتمال تطبيق هذه الطريقة في النموذج القادم. رغم أن بعض المحللين، مثل أليستير بار من "بزنيس إنسايدر"، يشككون في تأثير النماذج السابقة لـ R1 على السوق، مُحذّرين من أن التوزيع واسع النطاق لا يزال مفقودًا لـ ديب سيك، خصوصًا في الأسواق الغربية، فإن تجربة الشركة في تطوير نماذج مُبتكرة تُشير إلى احتمال تطبيق mHC في نموذج V4، بدلًا من إطلاق نموذج منفصل.
