إعادة تشغيل تجربة ذات أولوية
إعادة تشغيل التجارب ذات الأولوية هي طريقة للتعلم التعزيزي تعمل على إعادة تشغيل التجارب بترددات مختلفة بناءً على أهميتها، وبالتالي تحسين كفاءة التعلم. تم اقتراح هذه الطريقة من قبل توم شول وجون كوان وإيوانيس أنطونوغلو وديفيد سيلفر من Deepmind في عام 2015 ونشرت في ورقة مؤتمر ICLR لعام 2016 "إعادة تشغيل تجربة ذات أولويةالفكرة الأساسية لإعادة عرض التجارب ذات الأولوية هي أن جميع التجارب ليست متساوية الأهمية للتعلم. قد تكون بعض التجارب أكثر قيمة لأنها تقدم قيمة غير متوقعة أو قيمة تعليمية، ويجب إعادة عرضها بشكل متكرر.