Command Palette
Search for a command to run...
ما وراء منقي الغاوسي: التعلّم المتبقّي للشبكات العصبية العميقة ذات التحويلات المتعددة لتنقية الصور
ما وراء منقي الغاوسي: التعلّم المتبقّي للشبكات العصبية العميقة ذات التحويلات المتعددة لتنقية الصور
Zhang Kai Zuo Wangmeng Chen Yunjin Meng Deyu Zhang Lei
الملخص
لقد لاقت نماذج التعلّم التمييزيية لتنقية الصور اهتمامًا كبيرًا مؤخرًا بفضل أدائها المتميز في تنقية الصور. وفي هذه الورقة، نتقدّم خطوة متقدمة من خلال دراسة بناء شبكات عصبية تلافيفية لتنقية الصور (DnCNNs) ذات تدفق أمامي، بهدف دمج التقدم المحرز في البنية العميقة جدًا، وخوارزميات التعلّم، وطرق الت régularization في مجال تنقية الصور. وبشكل خاص، نستخدم التعلّم المتبقّي (residual learning) والتوحيد الدُفعي (batch normalization) لتسريع عملية التدريب وتحسين أداء تنقية الصور. على عكس النماذج التمييزية الحالية لتنقية الصور التي تُدرّب عادةً نموذجًا محددًا لكل نوع من الضوضاء البيضاء الغاوسية الإضافية (AWGN) عند مستوى ضوضاء معين، فإن نموذج DnCNN الخاص بنا قادر على التعامل مع تنقية الغاوسية ذات مستوى ضوضاء غير معروف (أي تنقية غاوسية عمياء). وباستخدام استراتيجية التعلّم المتبقّي، يُزيل DnCNN بشكل ضمني الصورة النظيفة المخفية في الطبقات الداخلية. ويحفّز هذا السلوكنا على تدريب نموذج DnCNN واحد قادر على التعامل مع عدة مهام عامة لتنقية الصور، مثل تنقية الغاوسية، وتحسين دقة الصورة الفردية (Single Image Super-Resolution)، وتفادي تداخل صور جيبي (JPEG Image Deblocking). وتُظهر التجارب الواسعة التي أجريناها أن نموذج DnCNN الخاص بنا لا يُظهر فعالية عالية في عدة مهام عامة لتنقية الصور فحسب، بل يمكن تنفيذه بكفاءة بفضل الحوسبة باستخدام وحدات المعالجة الرسومية (GPU).