HyperAIHyperAI
منذ 10 أيام

الإخراجات المتعددة هي كل ما تحتاجه للإزالة التلقائية للضبابية

Sidun Liu, Peng Qiao, Yong Dou
الإخراجات المتعددة هي كل ما تحتاجه للإزالة التلقائية للضبابية
الملخص

إن مهمة إزالة الضبابية من الصور تُعد مهمة غير محددة جيدًا، حيث توجد عدد لا نهائي من الحلول الممكنة للصورة الضبابية. غالبًا ما تتجاهل النماذج الحديثة القائمة على التعلم العميق تعلُّم نوى الضبابية (blur kernels) وتُطبّق التعلم المراقب من الطرف إلى الطرف مباشرة. وتعتبر المجموعات الشهيرة للبيانات الخاصة بإزالة الضبابية العلامة (label) على أنها واحدة من الحلول الممكنة. ومع ذلك، نحن نرى أن تحديد العلامة بشكل مباشر ليس منطقيًا، خصوصًا عندما تُستخرج هذه العلامة من توزيع عشوائي. لذلك، نقترح على الشبكة أن تتعلم التوزيع الخاص بالحلول الممكنة، ونُصمم بناءً على هذه الفكرة بنية مخرجة متعددة الرؤوس (multi-head output architecture) ودالة خسارة مُقابلة لتعلم التوزيع. يُمكّن هذا النهج النموذج من إنتاج عدة حلول ممكنة تُقرب التوزيع المستهدف. بالإضافة إلى ذلك، نقترح طريقة جديدة لدمج المعاملات (parameter multiplexing) تقلل من عدد المعاملات والجهد الحسابي مع تحسين الأداء. تم تقييم نهجنا على عدة نماذج لإزالة الضبابية، بما في ذلك نموذج NAFNet الحاصل على أفضل الأداء الحالي. وقد تفوق تحسين الـ PSNR الأعلى بشكل عام (أي اختيار أعلى قيمة بين عدة رؤوس لكل صورة تحقق) على النماذج المُقارنة بنسبة تصل إلى 0.11–0.18 ديسيبل. كما تفوق تحسين الـ PSNR للرأس الأفضل وحيدًا (أي اختيار الرأس الأفضل بين الرؤوس المتعددة على مجموعة التحقق) على النماذج المُقارنة بنسبة تصل إلى 0.04–0.08 ديسيبل. يمكن الوصول إلى الشيفرة المصدرية عبر الرابط: https://github.com/Liu-SD/multi-output-deblur.