شبكة مشفرة-فكّر جديدة مع خريطة نقل موجهة لاسترجاع الصورة الواحدة من الضباب

في هذه الورقة، تم اقتراح شبكة جديدة من نوع Encoder-Decoder تُعرف بـ EDN-GTM (شبكة مُشفِّرة-مُفكّكة ذات خريطة نقل مُوجَّهة) لتحسين صورة واحدة من الضباب. تعتمد الشبكة المُقترحة EDN-GTM على صورة ضبابية تقليدية باللون RGB، إلى جانب خريطة النقل المُقدَّرة باستخدام مبدأ القناة الداكنة (Dark Channel Prior) كمدخلات للشبكة. وتُستخدم شبكة U-Net كشبكة أساسية للتمييز الصوتي (Image Segmentation)، مع تطبيق عدة تحسينات تشمل وحدة التجميع الهرمي المكاني (Spatial Pyramid Pooling Module) ووظيفة التنشيط Swish، مما يُحقق أداءً متفوقًا في إزالة الضباب مقارنةً بأفضل الطرق التقليدية والحديثة القائمة على التعلم العميق. أظهرت التجارب على مجموعات بيانات معيارية أن الشبكة المُقترحة EDN-GTM تتفوق على معظم الطرق التقليدية والقائمة على التعلم العميق من حيث مقاييس PSNR وSSIM. كما أثبتت الشبكة المُقترحة كفاءتها في تطبيقات كشف الكائنات. وبالتحديد، عند استخدامها كأداة ما قبل المعالجة في كشف الكائنات في سياق القيادة الذاتية، تمكنت EDN-GTM من إزالة الضباب بكفاءة، وتحسين دقة الكشف بنسبة 4.73% من حيث مقياس mAP. يمكن الوصول إلى الشفرة المصدرية عبر الرابط التالي: https://github.com/tranleanh/edn-gtm.