شبكات التوليد المتنافسة الواعية للجودة

شبكات التوليد المتنافسة (GANs) أصبحت أداة شائعة للغاية لتعلم توزيعات الاحتمالات ذات الأبعاد العالية بشكل ضمني. تم إجراء العديد من التحسينات على الصياغة الأصلية لـ GANs لمعالجة بعض عيوبها مثل الانهيار النمطي، مشاكل التقارب، التشابك، الجودة البصرية السيئة وغيرها. بينما تم توجيه جهد كبير نحو تحسين جودة الصور المرئية التي تولدتها شبكات GANs، فمن المدهش أن مقاييس الجودة الموضوعية للصور لم يتم استخدامها كدوال تكلفة أو كمعاقبات في دوال الهدف لـ GANs. في هذا العمل، نوضح كيف يمكن استخدام مقياس المسافة الذي يعتبر نوعًا من مؤشر التشابه الهيكلي (SSIM) (وهو خوارزمية تقييم جودة الصور المرجعية الكاملة الشائعة)، ومعاقبة تدرج المميز الجديد المستوحاة من مقيم جودة الصورة الطبيعية (NIQE) (وهو خوارزمية تقييم جودة الصور غير المرجعية الشائعة)، كلٌ منها كمعاقبات ممتازة لدوال الهدف لـ GANs. بخاصة، نظهر الأداء الرائد باستخدام إطار معاقبة تدرج Wasserstein GAN (WGAN-GP) على مجموعات البيانات CIFAR-10 وSTL10 وCelebA.