شبكة اندماج مُحَوِّلَة متبقية لتنقية الصور من الضوضاء الناتجة عن الملح والفلفل

تم استخدام الشبكة العصبية التلافيفية (CNN) على نطاق واسع في مجموعات البيانات غير المنظمة، من بينها إزالة الضوضاء من الصور. وتشير إزالة ضوضاء الصور إلى عملية إعادة بناء صور ملوثة بالضوضاء، بهدف تقليل الضوضاء الإضافية الناتجة عن الصورة المشوهة باستخدام استراتيجيات مختلفة. وتعاني إزالة ضوضاء الصور من مشكلة تتمثل في أن بعض الطرق المتبعة تتطلب معرفة مسبقة بخصائص الضوضاء. وللتغلب على هذه المشكلة، تم استخدام بنية مدمجة تجمع بين نموذج الرؤية التلافيفية (CvT) والشبكات المتبقية (ResNet)، والمعروفة باسم شبكة التكامل المتفرع للتحويل (RTF-Net). بشكل عام، يمكن تقسيم العملية في هذه البنية إلى جزئين: شبكة قمع الضوضاء (NSN) وشبكة تعزيز البنية (SEN). حيث تُستخدم كتلة التفرع (Residual Block) في شبكة قمع الضوضاء لتعلم خريطة الضوضاء داخل الصورة، بينما تُستخدم نموذج CvT في شبكة تعزيز البنية لاستيعاب التفاصيل التي يجب إضافتها إلى الصورة التي تم معالجتها بواسطة شبكة قمع الضوضاء. تم تدريب النموذج باستخدام مجموعة بيانات التدريب DIV2K، وتم التحقق من الأداء باستخدام مجموعة التحقق DIV2K. وبعد الانتهاء من التدريب، تم اختبار النموذج باستخدام صور لينا، وبرIDGE، وفلفل، وBSD300، بمستويات ضوضاء تتراوح بين 30٪ و50٪ و70٪، وتم مقارنة نتائج القيمة الذاتية لجودة الصورة (PSNR) مع الطرق الأخرى مثل DBA، NASNLM، PARIGI، NLSF، NLSF-MLP، وNLSF-CNN. أظهرت نتائج الاختبار أن الطريقة المقترحة تتفوق في جميع الحالات باستثناء صورة الفلفل عند مستوى ضوضاء 30٪، حيث تفوقت طريقة NLSF-CNN بقيمة PSNR تبلغ 32.99 ديسيبل، بينما حققت الطريقة المقترحة قيمة PSNR قدرها 31.70 ديسيبل.