DeepSeek تجرب تقنية "الانتباه النادر" لتقليل تكاليف معالجة الذكاء الاصطناعي
أعلنت مختبرات ديب سك (DeepSeek) عن إصدارها الجديد من نموذج الذكاء الاصطناعي، النسخة 3.2، والتي تجرب تقنية جديدة تُعرف بـ"الانتباه النادر" (sparse attention)، في خطوة تهدف إلى تقليل تكاليف معالجة الذكاء الاصطناعي بشكل كبير. ويُعد هذا التطور خطوة مهمة في مساعي تطوير نماذج ذكاء اصطناعي أكثر كفاءة من حيث الموارد، دون التضحية بالكفاءة أو الدقة. تقنية "الانتباه النادر" تمثل تطورًا في طريقة معالجة النماذج للبيانات، حيث لا تُركز على كل كلمة أو عنصر في المدخلات، بل تختار فقط الأجزاء الأكثر أهمية للتحليل. في النماذج التقليدية من نوع "الانتباه" (attention)، يتم حساب العلاقة بين كل عنصر في المدخل وجميع العناصر الأخرى، ما يؤدي إلى تكاليف حسابية عالية، خاصة مع النماذج الكبيرة التي تتضمن ملايين أو حتى مليارات المعلمات. أما في النموذج الجديد من ديب سك، فيتم تقليل عدد هذه الحسابات بشكل كبير، مما يقلل من استهلاك الطاقة والوقت المطلوب لتشغيل النموذج. ووفقًا للمختبر، فإن هذه التقنية تُمكن من تشغيل نماذج ذكاء اصطناعي متقدمة على أجهزة أقل قوة، ما يفتح الباب أمام استخدامها في أجهزة شخصية أو في بيئات ذات موارد محدودة، مثل الأجهزة المحمولة أو الأنظمة الموزعة. كما تُقلل من التكاليف التشغيلية للشركات التي تعتمد على النماذج الكبيرة، خاصة في مهام مثل الترجمة، توليد النصوص، أو التحليل التلقائي للبيانات. النسخة 3.2 من نموذج ديب سك تُظهر نتائج مثيرة في الاختبارات الأولية، حيث تتفوق في بعض المهام على نماذج مشابهة من حيث الدقة، مع استهلاك طاقة أقل بنسبة تصل إلى 40% في بعض السيناريوهات. ويشير الباحثون في المختبر إلى أن هذا التقدم لا يُعد مجرد تحسين تقني، بل يُمثل نقلة نوعية في تفكيرنا حول كيفية تصميم النماذج الذكية في المستقبل. يأتي هذا الإصدار في سياق تنافس شديد بين مختبرات الذكاء الاصطناعي حول العالم، حيث تسعى الشركات إلى تطوير نماذج أسرع وأقل تكلفة، خاصة مع ارتفاع تكاليف البنية التحتية للذكاء الاصطناعي. وتُعد ديب سك واحدة من أبرز المختبرات الصينية التي تُظهر تقدمًا ملحوظًا في هذا المجال، بعد نجاحها السابق في إطلاق نماذج مثل DeepSeek-V2 وDeepSeek-MoE، التي تعتمد على مبادئ التصميم المُحسَّن للبنية. من المتوقع أن تُستخدم تقنية "الانتباه النادر" في مشاريع واسعة النطاق، من تطبيقات الذكاء الاصطناعي في الرعاية الصحية إلى الأنظمة الذكية في المدن، حيث تُعد الكفاءة والتكلفة عنصرين حاسمين. ورغم أن النموذج ما زال في مرحلة التجريب، إلا أن النتائج الأولية تُظهر وعودًا كبيرة لمستقبل أكثر استدامة في مجال الذكاء الاصطناعي.