Command Palette
Search for a command to run...
انهار جان؛ تُمَدَّدْ جان! قاعدة معاصرة لـ GAN
انهار جان؛ تُمَدَّدْ جان! قاعدة معاصرة لـ GAN
Yiwen Huang Aaron Gokaslan Volodymyr Kuleshov James Tompkin
الملخص
تُعتبر هناك ادعاءات شائعة تزعم صعوبة تدريب نماذج الشبكات التوليدية التناقضية (GANs)، وتعتبر هياكل GANs المنشورة في الأدبيات مليئة بالتقنيات التجريبية. ونقدّم أدلة تُنافِي هذا الادعاء، ونُنشئ قاعدة معيارية حديثة لـ GANs بطريقة أكثر تأصيلاً. أولاً، نُشتق خسارة GAN نسبي مُنظَّمة وذات سلوك جيد، تُعالج مشكلات مثل فقدان النمط (mode dropping) وعدم التقارب، التي كانت تُعالج سابقًا باستخدام مجموعة من التقنيات اليدوية المُتَعَلِّقة بسياق محدد. ونُحلِّل خسارة جديدة رياضيًا، ونُثبت أنها تضمن تقاربًا محليًا، على عكس معظم خسائر GAN النسبية الحالية. ثانيًا، تُمكّن خسارة جديدة من التخلي عن جميع التقنيات اليدوية، وتمكّن من استبدال الهياكل القديمة المستخدمة في GANs الشائعة ببنية معمارية حديثة. وباستخدام StyleGAN2 كمثال، نُقدّم خارطة طريق للتبسيط والتحديث، مما يؤدي إلى إنشاء قاعدة معيارية جديدة بسيطة جدًا – R3GAN. وعلى الرغم من بساطتها، تفوق منهجنا StyleGAN2 على مجموعات بيانات FFHQ وImageNet وCIFAR وStacked MNIST، وتمتاز بمنافسة قوية مع أحدث نماذج GAN والأنماط التفاضلية (diffusion models).