MambaIR: أساس بسيط لإعادة ترميم الصور باستخدام نموذج الفضاء الحالة

شهدت السنوات الأخيرة تطورات كبيرة في استرجاع الصور، ويعود ذلك بشكل كبير إلى تطور الشبكات العصبية العميقة الحديثة، مثل الشبكات العصبية التلافيفية (CNNs) ونماذج الـ Transformers. ومع ذلك، تواجه الخلفيات الحالية لاسترجاع الصور عادةً تنازعاً بين مجال الاستقبال العالمي والحساب الفعّال، مما يحد من تطبيقاتها العملية. في الآونة الأخيرة، أظهر نموذج الحالة الفضائية الهيكلية المختارة، وخاصة النسخة المحسّنة منه Mamba، إمكانات كبيرة في نمذجة الاعتماد الطويل المدى بتعقيد خطي، مما يوفر حلاً لحل هذا التناقض. ومع ذلك، ما يزال النموذج القياسي Mamba يواجه تحديات معينة في الرؤية منخفضة المستوى، مثل نسيان البكسل المحلي والتكرار القنوي. في هذه الدراسة، نقدم قاعدة بسيطة ولكن فعّالة، تُسمى MambaIR، والتي تُدخل تحسينات محلية وانتباه قنوي لتحسين النموذج الأساسي Mamba. وبهذا، تستفيد MambaIR من تشابه البكسل المحلي وتقلل من التكرار القنوي. أظهرت التجارب الواسعة تفوق طريقةنا، فمثلاً، تتفوق MambaIR على SwinIR بنسبة تصل إلى 0.45 ديسيبل في مهام استرجاع الصور (Image SR)، مع تكلفة حسابية مشابهة ولكن بوجود مجال استقبال عالمي. يمكن الوصول إلى الكود من خلال الرابط التالي: \url{https://github.com/csguoh/MambaIR}.