تدفق المعلومات الهرمي لاستعادة الصور بطرق معممة وكفوءة

بينما تظهر نماذج التحويل البصري (Vision Transformers) وعودًا في العديد من مهام استعادة الصور (Image Restoration - IR)، لا يزال التحدي قائماً في تعميم وتضخيم النموذج بكفاءة لمهام متعددة من IR. لموازنة الكفاءة وسعة النموذج في طريقة استعادة الصور المعتمدة على التحويلات بشكل عام، نقترح آلية تدفق المعلومات الهرمية، والتي أطلقنا عليها اسم Hi-IR، والتي تنشر المعلومات بين البكسلات بطريقة تصاعدية من الأسفل إلى الأعلى.يقوم Hi-IR ببناء شجرة معلومات هرمية تمثل الصورة المتدنية الجودة عبر ثلاثة مستويات. يغلف كل مستوى أنواعًا مختلفة من المعلومات، حيث يشمل المستويات الأعلى كائنات ومفاهيم أوسع، بينما يركز المستويات الأدنى على التفاصيل المحلية. بالإضافة إلى ذلك، فإن بنية الشجرة الهرمية تزيل انتباه الذات على المدى الطويل (Long-range Self-Attention)، مما يحسن كفاءة الحساب واستخدام الذاكرة، وبالتالي يعد النموذج للتوسع الفعال. بناءً على ذلك، نستكشف توسع النموذج لتحسين قدرات طريقتنا، وهو ما يتوقع أن يؤثر إيجابياً على IR في بيئات التدريب ذات الحجم الكبير.تظهر النتائج التجريبية الواسعة أن Hi-IR حققت أداءً رائدًا في سبع مهام شائعة لاستعادة الصور، مما يؤكد فعاليتها وقدرتها على التعميم.