منذ 7 أشهر

الملخص

مجتمع التعلم العميق بالتعزيز قد أدخل عدة تحسينات مستقلة على خوارزمية DQN. ومع ذلك، فإنها غير واضحة فيما يتعلق بتكملة هذه التعديلات وما إذا كان يمكن دمجها بشكل مثمر. يدرس هذا البحث ستة تعديلات لخوارزمية DQN ويقوم بدراستها تجريبيًا من خلال الدمج. تظهر تجاربنا أن هذا الدمج يقدم أداءً في طليعة المجال على معيار Atari 2600، سواء من حيث كفاءة البيانات أو الأداء النهائي. كما نقدم أيضًا نتائج دراسة تقليص مفصلة توضح مساهمة كل مكون في الأداء الكلي.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار