EnhanceNet: تحسين دقة الصورة الفردية من خلال التركيب النسيجي الآلي

الترميز الفائق للصورة الواحدة هو مهمة استنتاج صورة ذات دقة عالية من مدخل واحد ذو دقة منخفضة. تقليديًا، يتم قياس أداء الخوارزميات لهذه المهمة باستخدام مقاييس إعادة بناء على مستوى البكسل مثل نسبة الإشارة إلى الضوضاء القصوى (PSNR)، والتي أظهرت أنها ترتبط بشكل ضعيف مع إدراك الإنسان لجودة الصورة. نتيجة لذلك، فإن الخوارزميات التي تعمل على تقليل هذه المقاييس تميل إلى إنتاج صور مفرطة في التمهيد والتي تفتقر إلى النسيج عالي التردد ولا تبدو طبيعية رغم حصولها على قيم PSNR مرتفعة.نقترح تطبيقًا جديدًا للمحاكاة الآلية للنسيج بالاشتراك مع خسارة حسية تركز على إنشاء نسيج واقعي بدلاً من العمل على تحقيق إعادة إنتاج دقيقة للصور الأصلية أثناء التدريب. من خلال استخدام شبكات العصب الاصطناعية المُكَوِّنة بالكامل في إطار التدريب المعادي، نحقق زيادة كبيرة في جودة الصور عند نسب التكبير المرتفعة. أظهرت التجارب الواسعة على عدد من المجموعات البيانات فعالية نهجنا، مما أدى إلى الحصول على أفضل النتائج الحالية في المقاييس الكمية والنوعية.