تحليل وتحسين جودة الصورة في StyleGAN

يُحقق معمارية GAN القائمة على النمط (StyleGAN) نتائج رائدة في مجال النمذجة الصورية التوليدية غير المشروطة المعتمدة على البيانات. نُظهر ونحلل عدة من العيوب المميزة الخاصة بها، ونقترح تغييرات في بنية النموذج وطرق التدريب لمعالجة هذه العيوب. وبشكل خاص، نعيد تصميم التطبيع في المولّد، ونعيد النظر في تقنية النمو التدريجي، ونُنظم المولّد لتشجيع تحسين التقييم (conditioning) في التماثل من الرموز المخفية إلى الصور. بالإضافة إلى تحسين جودة الصور، يُحقّق هذا المُنظّم للمسافة الطولية فائدة إضافية تتمثل في جعل المولّد أسهل بكثير في التحويل العكسي (inversion). هذا يمكّن من تعيين صورة مولّدة بشكل موثوق إلى شبكة معينة. وعلاوةً على ذلك، نُصوّر مدى استخدام المولّد لقدراته في دقة العرض، ونُحدد مشكلة في القدرة، مما يدفعنا إلى تدريب نماذج أكبر لتحقيق تحسينات إضافية في الجودة. بشكل عام، يُعيد نموذجنا المحسّن تعريف الحد الأقصى من الأداء في النمذجة الصورية غير المشروطة، سواء من حيث مقاييس جودة التوزيع القائمة أو من حيث جودة الصور المُدرَكة.