HyperAIHyperAI
منذ 2 أشهر

شبكة مرحلة واحدة على شكل جبل لاستعادة الصور بدقة

Hu Gao; Jing Yang; Ying Zhang; Ning Wang; Jingfan Yang; Depeng Dang
شبكة مرحلة واحدة على شكل جبل لاستعادة الصور بدقة
الملخص

إعادة بناء الصورة هي مهمة تهدف إلى الحصول على صورة عالية الجودة من صورة مدخلة معيبة، مثل إزالة الضبابية وإزالة المطر. في إعادة بناء الصورة، من الضروري عادةً الحفاظ على توازن معقد بين التفاصيل المكانية والمعلومات السياقية. رغم أن شبكة متعددة المراحل يمكن أن تحقق هذا التوازن بشكل مثالي وتصل إلى أداء كبير، فإن ذلك يزيد أيضًا من تعقيد النظام. في هذه الورقة البحثية، نقترح تصميمًا ذو مرحلة واحدة على شكل جبل يعتمد على هندسة U-Net البسيطة، حيث يتم إزالة أو استبدال وظائف التنشيط اللاخطية غير الضرورية لتحقيق التوازن المذكور بأقل تعقيد للنظام. تحديدًا، نقترح آلية دمج الخصائص (FFM) كمكون لتبادل المعلومات بين مستويات الهندسة المشفرة-المفككة. تقوم هذه الآلية بدمج المعلومات من المستويات العلوية بشكل سلس في المستوى الأدنى المجاور لها، تباعًا حتى أدنى مستوى. في النهاية، يتم دمج جميع المعلومات في مستوى معالجة الدقة الأصلية للصورة. هذا يحافظ على التفاصيل المكانية ويتكامل مع المعلومات السياقية، مما يضمن إعادة بناء صورة عالية الجودة. بالإضافة إلى ذلك، نقترح كتلة انتباه متعددة الرؤوس (MHAMB) كجسر بين المشفر والمفكك لالتقاط المزيد من المعلومات العالمية والتغلب على حدود المجال المستقبل لشبكات CNN. تثبت التجارب الواسعة أن نهجنا الذي أطلقنا عليه اسم M3SNet يتفوق على النماذج السابقة الأكثر تقدمًا بينما يستخدم أقل من نصف تكاليف الحسابات لمهام إعادة بناء الصور المختلفة مثل إزالة المطر وإزالة الضبابية.