
الملخص
نُقدِّم خوارزمية "EGGROLL" (التحسين العام المُوجَّه بالتطور من خلال التعلم من الرتبة المنخفضة)، وهي خوارزمية تعتمد على استراتيجيات التطور (Evolution Strategies - ES)، مصممة لتمكين التحسين دون استخدام التدرج العكسي (backprop-free) على حجم سكان كبير في الهياكل العصبية الكبيرة الحديثة التي تحتوي على مليارات المعاملات. تُعد استراتيجيات التطور مجموعة من أساليب التحسين البيضاء المظلمة القوية، التي تمتلك قدرة ممتازة على التعامل مع الدوال الهدف غير القابلة للتفاضل أو المُشوشة، مع إمكانية تحسين الأداء بشكل كبير من خلال التوازي. ومع ذلك، تصبح الاستراتيجيات التقليدية لـ ES مكلفة بشكل لا يمكن تحمّله عند التوسع، وذلك بسبب التكاليف الحسابية والذاكرة المرتبطة بإنشاء الاضطرابات المصفوفية، والحاجة إلى عمليات ضرب مصفوفات متعددة في حزم لحساب التمريرات الأمامية لكل عضو في السكان. تتجاوز خوارزمية EGGROLL هذه العقبات من خلال إنشاء مصفوفات عشوائية ذات رتبة منخفضة، بحيث تُكوّن اضطرابًا مصفوفيًا من الرتبة المنخفضة ( \mathbf{P} \in \mathbb{R}^{d \times k} ) (حيث ( k \ll d ))، والتي تُستخدم بدلًا من الاضطرابات ذات الرتبة الكاملة. وبما أن التحديث الكلي هو متوسط التحديثات عبر مجموعة من العمال (workers)، فإن هذا يُنتج تحديثًا ذا رتبة عالية في النهاية، مع توفير كبير في الذاكرة والحساب، حيث يتم خفض التخزين الثانوي من ( \mathcal{O}(d^2) ) إلى ( \mathcal{O}(dk) ) لكل طبقة، وتقليل تكلفة التمرير الأمامي من ( \mathcal{O}(d^2) ) إلى ( \mathcal{O}(dk) ) مقارنةً بخوارزمية ES ذات الرتبة الكاملة. أظهرت التحليلات النظرية أن تحديث الرتبة المنخفضة الذي نقترحه يتوافق مع التحديث ذي الرتبة الكاملة بمعدل تقارب سريع من الدرجة ( \mathcal{O}(1/k) ). كما أظهرت التجارب أن: (1) لا يُضعف EGGROLL أداء خوارزمية ES في بيئات التعلم بالتجريب (tabula-rasa RL)، رغم سرعته الفائقة؛ (2) يُعد منافسًا قويًا لتقنية GRPO في تحسين التفكير باللغات الكبيرة (LLM)؛ و(3) يُمكّن من تدريب نموذج لغوي دوري غير خطي بشكل مستقر، يعمل بالكامل باستخدام أنماط بيانات صحيحة (integer datatypes)، دون الحاجة إلى العمليات الحسابية ذات الدقة العائمة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.