HyperAIHyperAI

Command Palette

Search for a command to run...

قوس قزح: دمج التحسينات في التعلم العميق بالتعزيز

Tom Schaul Junyoung Chung David Hessel David Silver Volodymyr Mnih

الملخص

مجتمع التعلم العميق بالتعزيز قد أدخل عدة تحسينات مستقلة على خوارزمية DQN. ومع ذلك، فإنها غير واضحة فيما يتعلق بتكملة هذه التعديلات وما إذا كان يمكن دمجها بشكل مثمر. يدرس هذا البحث ستة تعديلات لخوارزمية DQN ويقوم بدراستها تجريبيًا من خلال الدمج. تظهر تجاربنا أن هذا الدمج يقدم أداءً في طليعة المجال على معيار Atari 2600، سواء من حيث كفاءة البيانات أو الأداء النهائي. كما نقدم أيضًا نتائج دراسة تقليص مفصلة توضح مساهمة كل مكون في الأداء الكلي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp