تحسين ضغط جيما 4 للأجهزة
أعلنت جوجل عن إطلاق فحوصات جديدة لنماذج جيما 4 محسّنة بتقنية التدريب واعٍ بالضغط، بهدف تحسين كفاءة التشغيل على الأجهزة الطرفية والهواتف المحمولة وأجهزة الحاسوب الشخصي. يأتي هذا الإعلان بعد شهرين من إطلاق الجيل الأول، والذي سبق أن شهد إضافة ميزة التنبؤ متعدد الرموز لتسريع الاستنتاج، وإصدار نموذج جديد بحجم 12 مليار معلمة لموازنة الأداء بين الإصدارات السابقة. تعتمد التقنية الجديدة على محاكاة عملية الضغط أثناء مرحلة التدريب الفعلية، مما يقلل بشكل كبير من فقدان الدقة عند تحويل النموذج إلى تنسيقات ذات حجم أصغر. وتشمل التحديثات المتاحة صيغة الضغط القياسية Q4_0، بالإضافة إلى صيغة مطورة خصيصاً للأجهزة المحمولة. وساهم هذا النهج في خفض المتطلبات الذاكرةي للنموذج جيما 4 إصدار E2B إلى غيغابت واحد فقط، مع الحفاظ الكامل على الجودة والقدرة الاستنتاجية. تُعد عملية الضغط حجر الزاوية لتمكين تشغيل النماذج اللغوية الكبيرة على العتاد الاستهلاكي، حيث تخفض استهلاك الذاكرة وتسرع سرعة الاستنتاج. ومع ذلك، غالباً ما تؤدي أساليب الضغط التقليدية التي تُطبق بعد اكتمال التدريب إلى تدهور ملحوظ في الأداء. على عكس ذلك، يدمج التدريب واعٍ بالضغط قيود الضغط مباشرة داخل دورة التطوير، مما ينتج عنه دقة أعلى مقارنةً بأساسيات الضغط ما بعد التدريب القياسية. وقد طُبقت هذه الصيغة على جميع طرازات جيما 4 لتعزيز الكفاءة، بينما خضعت النماذج الطرفية E2B وE4B لإعادة هندسة خوارزمية الضغط لتتوافق تماماً مع قيود الأجهزة المحمولة. تتيح هذه التحسينات نطاقاً أوسع لتشغيل النماذج المتقدمة محلياً دون الاعتماد على البنية التحتية السحابية، مما يعزز سرعة الاستجابة ويخفض التكاليف التشغيلية على الأجهزة الاستهلاكية.
