شبكة انتباه تناقضية مزدوجة للإزالة التلقائية للضوضاء من الصور

في تصفية الصور من الضوضاء، يمكن لشبكات التعلم العميق ذات التحويلات التلافيفية (CNNs) تحقيق أداءً مرضٍ في إزالة الضوضاء الثابتة مكانيًا. ومع ذلك، فإن العديد من هذه الشبكات لا تؤدي أداءً جيدًا في إزالة الضوضاء الحقيقية (أي الضوضاء المتغيرة مكانيًا) الناتجة أثناء اقتناء الصور أو نقلها، مما يعيق بشكل كبير تطبيقاتها في المهام العملية لتصفية الصور. بدلًا من الاستمرار في زيادة عمق الشبكة، أظهر العديد من الباحثين أن توسيع عرض الشبكة يمكن أن يكون أيضًا طريقة فعالة لتحسين أداء النموذج. كما تأكد أن عملية تصفية الميزات يمكن أن تعزز قدرة النماذج على التعلم. لذلك، في هذه الورقة، نقترح شبكة جديدة ذات فرعين (DRANet) تعتمد على الانتباه والانعكاس، لتصفية الصور، والتي تجمع بين مزايا البنية العريضة للنموذج وتعلم الميزات الموجه بالانتباه. تتضمن DRANet فرعين متوازيين مختلفين، يمكنهما التقاط ميزات مكملة لتعزيز قدرة النموذج على التعلم. وقد صممنا وحدة انتباه انعكاسية جديدة (RAB) ووحدة انتباه انعكاسية مختلطة ذات تباعد جديد (HDRAB) على التوالي للفرع العلوي والسفلي. وتستطيع وحدتا RAB وHDRAB التقاط ميزات محلية غنية من خلال اتصالات متعددة بالانعكاس بين طبقات التحويل التلافيفي المختلفة، بينما يتم التخلص من الميزات غير المهمة من خلال وحدات الانتباه الانعكاسية. وفي الوقت نفسه، تتيح الاتصالات الطويلة بالانعكاس في كل فرع، بالإضافة إلى دمج الميزات العالمية بين الفرعين المتوازيين، التقاط الميزات العالمية أيضًا. علاوةً على ذلك، تستخدم DRANet عمليات تقليل الحجم (downsampling) والتحويلات المتباعدة (dilated convolutions) لتوسيع حجم مجال الاستقبال (receptive field)، مما يمكّن DRANet من التقاط معلومات سياقية أكثر حول الصورة. وتبين التجارب الواسعة أن DRANet تحقق أداءً تنافسيًا متميزًا مقارنةً بطرق التصفية الحديثة الأخرى، سواء في إزالة الضوضاء الاصطناعية أو الضوضاء الحقيقية في البيئات الواقعية.