HyperAIHyperAI
منذ 17 أيام

DeblurDiNAT: نموذج مدمج يتمتع بقدرة تعميم استثنائية ووضوح بصري عالٍ على المجالات غير المرئية

Hanzhou Liu, Binghan Li, Chengkai Liu, Mi Lu
DeblurDiNAT: نموذج مدمج يتمتع بقدرة تعميم استثنائية ووضوح بصري عالٍ على المجالات غير المرئية
الملخص

أظهرت الشبكات الحديثة لتصحيح التشويش قدرة فعّالة على استعادة الصور الواضحة من الصور المشوّشة. ومع ذلك، غالبًا ما تواجه صعوبات في التعميم على مجالات غير معروفة. علاوةً على ذلك، تركز هذه النماذج عادةً على مقاييس التشوه مثل PSNR وSSIM، مما يتجاهل الجوانب الحاسمة المتعلقة بمقاييس متوافقة مع الإدراك البشري. لمعالجة هذه القيود، نقترح DeblurDiNAT، وهي شبكة ترانسفورمر لتصحيح التشويش تعتمد على انتباه الجوار الموسّع. أولاً، تستخدم DeblurDiNAT نموذجًا متغيرًا لعامل التوسيع المتتالي لالتقاط الأنماط المشوّشة المحلية والعالمية معًا، مما يعزز التعميم والوضوح الإدراكي. ثانيًا، يسهم مُتعلّم موضعي بين القنوات في مساعدة كتلة الترانسفورمر على فهم العلاقات القصيرة المدى بين القنوات المجاورة. بالإضافة إلى ذلك، نقدّم شبكة تغذية أمامية خطية ذات تصميم بسيط وفعال. وأخيرًا، نُقدّم وحدة دمج ميزات ثنائية المرحلة كبديل للنهج الحالي، والتي تُعالج بفعالية المعلومات البصرية متعددة المقياس عبر مستويات الشبكة. مقارنةً بالنماذج الرائدة في مجالها، تُظهر DeblurDiNAT المدمجة قدرات تعميم متفوّقة وتُحقّق أداءً ملحوظًا في مقاييس الإدراك، مع الحفاظ على حجم نموذج مواتٍ.