HyperAIHyperAI
منذ 2 أشهر

ESRGAN: شبكات التوليد المضادة المحسنة للدقة الفائقة

Xintao Wang; Ke Yu; Shixiang Wu; Jinjin Gu; Yihao Liu; Chao Dong; Chen Change Loy; Yu Qiao; Xiaoou Tang
ESRGAN: شبكات التوليد المضادة المحسنة للدقة الفائقة
الملخص

شبكة التوليد المضادة ذات الدقة الفائقة (SRGAN) هي عمل رئيسي قادر على توليد نصوص واقعية أثناء زيادة دقة الصورة الواحدة. ومع ذلك، فإن التفاصيل التي يتم تخيلها غالبًا ما تكون مصحوبة بعيوب غير مرغوب فيها. لتحسين الجودة البصرية بشكل أكبر، قمنا بدراستنا الشاملة لثلاثة مكونات رئيسية في SRGAN - هندسة الشبكة، الخسارة المعادية، والخسارة الإدراكية - وتحسين كل منها للحصول على شبكة SRGAN المحسنة (ESRGAN). بشكل خاص، قدمنا كتلة الكثافة المتبقية داخل الكثافة المتبقية (RRDB) بدون تطبيع الدفعة كوحدة بناء أساسية للشبكة. بالإضافة إلى ذلك، استلهمنا فكرة من GAN النسبية لجعل المميز يتنبأ بالواقعية النسبية بدلاً من القيمة المطلقة. وأخيرًا، قمنا بتحسين الخسارة الإدراكية باستخدام الخصائص قبل التنشيط، مما يمكن أن يوفر إشرافًا أقوى على اتساق السطوع واستعادة النسيج. بفضل هذه التحسينات، حققت ESRGAN المقترحة جودة بصرية أفضل بشكل مستمر مع نصوص أكثر واقعية وطبيعية من SRGAN وحازت على المركز الأول في تحدي PIRM2018-SR. الرمز متاح على https://github.com/xinntao/ESRGAN .