منذ 8 أشهر

الملخص

بينما تركز معظم الأبحاث الحالية في مجال التعلم التعزيزي (RL) على تحسين أداء الخوارزميات في بيئات مراقبة، فإن استخدام RL تحت القيود مثل تلك التي تواجهها صناعة ألعاب الفيديو يُدرس نادرًا. وفي إطار العمل تحت هذه القيود، نقترح خوارزمية SAC الهجينة، وهي امتداد لخوارزمية Soft Actor-Critic قادر على التعامل مع الأفعال المتقطعة والمستمرة والمعلمة بطريقة منهجية. نوضح أن Hybrid SAC يمكنه حل مهمة قيادة عالية السرعة في أحد ألعابنا بنجاح، وهو منافس للتقنيات الرائدة في مهام المعايير للأفعال المعلمة. كما نستكشف تأثير استخدام التدفقات التطبيعية لتعزيز قدرة السياسة التعبيرية بتكلفة حسابية ضئيلة، ونحدد آثارًا غير مرغوب فيها محتملة لـ SAC عند استخدامها مع التدفقات التطبيعية، والتي قد يتم معالجتها عن طريق تحسين هدف مختلف.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار