IRNeXt: إعادة التفكير في تصميم الشبكة التلافيفية لاسترجاع الصور
نقدّم نموذج IRNeXt، وهي بنية شبكة تلافيفية بسيطة ولكن فعّالة لاستعادة الصور. في الآونة الأخيرة، سيطرت نماذج الترانسفورمر على مجال استعادة الصور بفضل قدرتها القوية على نمذجة التفاعلات بين البكسلات البعيدة المدى. في هذه الورقة، نستعرض الإمكانات الكامنة في الشبكات العصبية التلافيفية (CNN)، ونُظهر أن نموذجنا القائم على الشبكة التلافيفية يمكنه تحقيق أداءً مماثلاً أو أفضل من نماذج الترانسفورمر، مع تكلفة حسابية منخفضة في عدة مهام استعادة الصور. من خلال إعادة تقييم الخصائص المميزة للخوارزميات المتقدمة في استعادة الصور، اكتشفنا عدّة عوامل رئيسية تُسهم في تحسين أداء نماذج الاستعادة. وهذا يُحفّزنا على تطوير شبكة جديدة لاستعادة الصور تعتمد على عمليات تلافيفية منخفضة التكلفة. تُظهر التجارب الشاملة أن IRNeXt تحقق أداءً من الدرجة الأولى بين العديد من المجموعات البيانات في مجموعة واسعة من مهام استعادة الصور، مع تعقيد حسابي منخفض، بما في ذلك إزالة الضباب من الصور، واستعادة الضوء المُضطرب أو المُحَوَّل من صورة واحدة، وإزالة المطر من الصور، وإزالة الثلوج من الصور.