التعلم المعزز متعدد الخطوات للتحديث الفائق للصورة الواحدة

أصبح التعلم العميق (DL) شائعًا في أبحاث معالجة الصور الحديثة بفضل قوته ومرونته. وقد سيطر على مجال تحسين دقة الصورة من صورة واحدة (SISR) بفضل قدرته على استرجاع صور عالية الدقة (HR) من نسخها منخفضة الدقة (LR)، وبخاصة باستخدام الشبكات التوليدية المتنافسة (GANs). ينشأ الاهتمام بـ SISR من إمكاناته في تعزيز أداء المهام الإضافية لمعالجة الصور مثل كشف الكائنات، وتحديد مواقعها، وتصنيفها. تهدف هذه الدراسة إلى تطبيق خوارزمية تعلم التعميق متعددة الوكلاء (RL) على مسألة SISR، مما يُنتج نهجًا متقدمًا مُجمَّعًا لدمج الشبكات التوليدية القوية. في تنفيذنا، يختار كل وكيل إجراءً محددًا من مجموعة إجراءات ثابتة تتألف من نتائج خوارزميات GANs الحالية لتحسين قيم البكسلات. ويشجع الترتيب البكسي أو المقطعى للوكلاء، إلى جانب مكافآتهم، الخوارزمية على تعلم استراتيجية لزيادة دقة الصورة من خلال اختيار أفضل قيم بكسلية من بين الخيارات المتاحة.