شبكة انتباه متعددة المقاييس متعددة المكونات مبنية على التباين (EMRA-net) للإزالة التلقائية للضباب من الصور
تهدف إزالة الضباب من الصور إلى استرجاع صورة نظيفة من صورة مغطاة بالضباب، وهي مشكلة صعبة ومستمرة منذ فترة طويلة. في هذه الورقة، نقترح شبكة تدريب متعددة المقاييس ذات انتباه متكرر مجمّع (EMRA-Net) لإنتاج صورة نظيفة مباشرة، وتتكون من جزأين: شبكة تعلم عميق ذات انتباه متعدد المقاييس (TRA-CNN)، وشبكة انتباه مجمّعة (EA-CNN). في TRA-CNN، نستخدم تحويل الموجات (Wavelet Transform) للحصول على صور مُخفّضة المدى، بدلاً من استخدام أساليب تقليل الحجم المكاني الشائعة مثل التقليل بالأقرب جار (Nearest Downsampling) والانسيابية بالانسيابية (Strided-Convolution). وباستخدام تحويل الموجات، يمكننا تجنب فقدان تفاصيل النسيج في الصورة. علاوة على ذلك، في كل فرع مقياس، يتم ربط وحدات Res2Net بشكل متسلسل للاستفادة الكاملة من الخصائص الهرمية المستمدة من الصور المضبوبة أصلاً، ويُدمج آلية الانتباه القنوي لتركيز الانتباه على المعلومات في بعد القنوات. وأخيراً، تم اقتراح شبكة EA-CNN لدمج الصور الخشنة الناتجة من TRA-CNN لإنتاج صورة نظيفة مُحسّنة. أثبتت التجارب الواسعة على مجموعات بيانات مُصطنعة معيارية للصور المضبوبة، بالإضافة إلى مجموعة بيانات واقعية للصور المضبوبة، أن EMRA-Net المُقترحة تتفوق على الطرق الحديثة السابقة من حيث التقييم البصري الذاتي ومقاييس تقييم جودة الصورة الموضوعية.