HyperAIHyperAI
منذ 17 أيام

تحسين البنية العصبية لوكالات التعلم التعزيزي

N. Mazyavkina, S. Moustafa, I. Trofimov, E. Burnaev
تحسين البنية العصبية لوكالات التعلم التعزيزي
الملخص

حققت التعلم المعزز (RL) تقدماً ملحوظاً خلال السنوات الأخيرة. وكان أحد أهم الخطوات المهمة تطبيق الشبكات العصبية على نطاق واسع. ومع ذلك، تُبنى عادةً هياكل هذه الشبكات العصبية يدوياً. في هذه الدراسة، نستعرض الطرق الحديثة المُقترحة لبحث الهيكل الشبكي (NAS) بهدف تحسين هيكل وكفاءة الوكلاء في التعلم المعزز. ونُجري تجارب على معيار أتاري، ونتوصل إلى أن الطرق الحديثة لـ NAS تُنتج هياكل لوكالات التعلم المعزز تفوق الهيكل المُختار يدوياً من حيث الأداء.