HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أيام

استراتيجيات التطور على نطاق الفائق

استراتيجيات التطور على نطاق الفائق

الملخص

نُقدِّم خوارزمية "EGGROLL" (التحسين العام المُوجَّه بالتطور من خلال التعلم من الرتبة المنخفضة)، وهي خوارزمية تعتمد على استراتيجيات التطور (Evolution Strategies - ES)، مصممة لتمكين التحسين دون استخدام التدرج العكسي (backprop-free) على حجم سكان كبير في الهياكل العصبية الكبيرة الحديثة التي تحتوي على مليارات المعاملات. تُعد استراتيجيات التطور مجموعة من أساليب التحسين البيضاء المظلمة القوية، التي تمتلك قدرة ممتازة على التعامل مع الدوال الهدف غير القابلة للتفاضل أو المُشوشة، مع إمكانية تحسين الأداء بشكل كبير من خلال التوازي. ومع ذلك، تصبح الاستراتيجيات التقليدية لـ ES مكلفة بشكل لا يمكن تحمّله عند التوسع، وذلك بسبب التكاليف الحسابية والذاكرة المرتبطة بإنشاء الاضطرابات المصفوفية، والحاجة إلى عمليات ضرب مصفوفات متعددة في حزم لحساب التمريرات الأمامية لكل عضو في السكان. تتجاوز خوارزمية EGGROLL هذه العقبات من خلال إنشاء مصفوفات عشوائية ذات رتبة منخفضة، بحيث تُكوّن اضطرابًا مصفوفيًا من الرتبة المنخفضة ( \mathbf{P} \in \mathbb{R}^{d \times k} ) (حيث ( k \ll d ))، والتي تُستخدم بدلًا من الاضطرابات ذات الرتبة الكاملة. وبما أن التحديث الكلي هو متوسط التحديثات عبر مجموعة من العمال (workers)، فإن هذا يُنتج تحديثًا ذا رتبة عالية في النهاية، مع توفير كبير في الذاكرة والحساب، حيث يتم خفض التخزين الثانوي من ( \mathcal{O}(d^2) ) إلى ( \mathcal{O}(dk) ) لكل طبقة، وتقليل تكلفة التمرير الأمامي من ( \mathcal{O}(d^2) ) إلى ( \mathcal{O}(dk) ) مقارنةً بخوارزمية ES ذات الرتبة الكاملة. أظهرت التحليلات النظرية أن تحديث الرتبة المنخفضة الذي نقترحه يتوافق مع التحديث ذي الرتبة الكاملة بمعدل تقارب سريع من الدرجة ( \mathcal{O}(1/k) ). كما أظهرت التجارب أن: (1) لا يُضعف EGGROLL أداء خوارزمية ES في بيئات التعلم بالتجريب (tabula-rasa RL)، رغم سرعته الفائقة؛ (2) يُعد منافسًا قويًا لتقنية GRPO في تحسين التفكير باللغات الكبيرة (LLM)؛ و(3) يُمكّن من تدريب نموذج لغوي دوري غير خطي بشكل مستقر، يعمل بالكامل باستخدام أنماط بيانات صحيحة (integer datatypes)، دون الحاجة إلى العمليات الحسابية ذات الدقة العائمة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استراتيجيات التطور على نطاق الفائق | الأوراق البحثية | HyperAI