ESRGAN: شبكات التوليد المضادة المحسنة للدقة الفائقة

شبكة التوليد المضادة ذات الدقة الفائقة (SRGAN) هي عمل رئيسي قادر على توليد نصوص واقعية أثناء زيادة دقة الصورة الواحدة. ومع ذلك، فإن التفاصيل التي يتم تخيلها غالبًا ما تكون مصحوبة بعيوب غير مرغوب فيها. لتحسين الجودة البصرية بشكل أكبر، قمنا بدراستنا الشاملة لثلاثة مكونات رئيسية في SRGAN - هندسة الشبكة، الخسارة المعادية، والخسارة الإدراكية - وتحسين كل منها للحصول على شبكة SRGAN المحسنة (ESRGAN). بشكل خاص، قدمنا كتلة الكثافة المتبقية داخل الكثافة المتبقية (RRDB) بدون تطبيع الدفعة كوحدة بناء أساسية للشبكة. بالإضافة إلى ذلك، استلهمنا فكرة من GAN النسبية لجعل المميز يتنبأ بالواقعية النسبية بدلاً من القيمة المطلقة. وأخيرًا، قمنا بتحسين الخسارة الإدراكية باستخدام الخصائص قبل التنشيط، مما يمكن أن يوفر إشرافًا أقوى على اتساق السطوع واستعادة النسيج. بفضل هذه التحسينات، حققت ESRGAN المقترحة جودة بصرية أفضل بشكل مستمر مع نصوص أكثر واقعية وطبيعية من SRGAN وحازت على المركز الأول في تحدي PIRM2018-SR. الرمز متاح على https://github.com/xinntao/ESRGAN .