HyperAIHyperAI
منذ 19 أيام

التحكم البطولي دون نموذج باستخدام التجميع الحالة

Rafael Pinto
التحكم البطولي دون نموذج باستخدام التجميع الحالة
الملخص

يُعد التحكم الدوري طريقةً فعّالة جدًا من حيث الاستخدام العيني في التعلم التوسعي، مع فرض متطلبات عالية من الذاكرة والحساب. تُقترح في هذه الدراسة خوارزمية بسيطة لتقليل هذه المتطلبات، وتُقدّم تطبيقها على التحكم الدوري دون نموذج (MFEC). تُظهر التجارب على ألعاب آتاري أن هذه الخوارزمية تقلل بنجاح من متطلبات الحوسبة الخاصة بـ MFEC، دون أن تؤدي إلى خسارة ملحوظة في الأداء، خاصة عند استخدام قيم متحفظة للمعاملات الفائقة. وبالتالي، يصبح التحكم الدوري خيارًا أكثر إمكانية عند التعامل مع مهام التعلم التوسعي.