Command Palette
Search for a command to run...
قوس قزح: دمج التحسينات في التعلم العميق بالتعزيز
قوس قزح: دمج التحسينات في التعلم العميق بالتعزيز
Tom Schaul Junyoung Chung David Hessel David Silver Volodymyr Mnih
الملخص
مجتمع التعلم العميق بالتعزيز قد أدخل عدة تحسينات مستقلة على خوارزمية DQN. ومع ذلك، فإنها غير واضحة فيما يتعلق بتكملة هذه التعديلات وما إذا كان يمكن دمجها بشكل مثمر. يدرس هذا البحث ستة تعديلات لخوارزمية DQN ويقوم بدراستها تجريبيًا من خلال الدمج. تظهر تجاربنا أن هذا الدمج يقدم أداءً في طليعة المجال على معيار Atari 2600، سواء من حيث كفاءة البيانات أو الأداء النهائي. كما نقدم أيضًا نتائج دراسة تقليص مفصلة توضح مساهمة كل مكون في الأداء الكلي.