تمّ موت GAN؛ حيّوا GAN! قاعدة معيارية حديثة لـ GAN

تُروج شائعة شائعة بأن الشبكات التوليدية التنافسية (GANs) صعبة التدريب، وأن معمارية GANs المنشورة في الأدبيات مليئة بالتقنيات التجريبية. نقدم أدلة تناقض هذه الشائعة، ونُنشئ قاعدة معيارية حديثة لـ GANs بطريقة أكثر منهجية. أولاً، نستنتج خسارة GAN نسبيًا مُنظمة وذات سلوك جيد، تُعالج مشكلات مثل فقدان النمط (mode dropping) وعدم التقارب التي كانت تُعالج سابقًا باستخدام مجموعة من التقنيات العرضية (ad-hoc tricks). ونحلل خسارة جديدة هذه رياضيًا، ونثبت أنها تُحقق ضمانات تقارب محلي، على عكس معظم الخسائر النسبية الحالية. ثانيًا، تسمح لنا هذه الخسارة الجديدة بالتخلص من جميع التقنيات العرضية، واستبدال الهياكل القديمة المستخدمة في GANs الشائعة بهياكل حديثة. وباستخدام StyleGAN2 كمثال، نقدّم خارطة طريق للتبسيط والتحديث، مما يؤدي إلى إنشاء قاعدة معيارية جديدة ذات طابع مبسط – R3GAN. وعلى الرغم من بساطتها، تفوق طريقة عملنا على StyleGAN2 على مجموعات بيانات FFHQ، ImageNet، CIFAR، وStacked MNIST، وتنافس بشكل مُرضٍ النماذج المتقدمة الحالية من GANs والنموذج التفريقي (diffusion models).