التنظيم المتسق لشبكات التوليد التنافسية

تُعرف شبكات التوليد التنافسيّة (GANs) بأنها صعبة التدريب، رغم الجهود البحثية الكبيرة المبذولة. وقد تم اقتراح عدة تقنيات للتنعيم (Regularization) لاستقرار عملية التدريب، لكنها تُدخل أحمالًا حسابية غير بسيطة وتعمل بشكل غير مرضٍ مع التقنيات الحالية مثل التطبيع الطيفي (Spectral Normalization). في هذا العمل، نقترح مُستَقرَّة تدريب بسيطة وفعّالة تعتمد على مفهوم التماسك التناضري (Consistency Regularization)—وهي تقنية شائعة في أدبيات التعلّم شبه المُراقب. وبشكل خاص، نُعدّل البيانات المُمرّرة إلى المُميّز (Discriminator) في GAN، ونُعاقب حساسية المُميّز تجاه هذه التحويلات. نُجري سلسلة من التجارب لتوضيح أن التماسك التناضري يعمل بكفاءة مع التطبيع الطيفي، بالإضافة إلى مختلف هياكل GAN، ووظائف الخسارة، وأساليب المُحسّن (Optimizer). تُحقّق طريقةنا أفضل مقاييس FID للإدخال الصوري غير المشروط مقارنةً بطرق التماسك الأخرى على مجموعتي بيانات CIFAR-10 وCelebA. علاوةً على ذلك، فإن نموذج GAN القائم على التماسك التناضري (CR-GAN) يُحسّن من أداء أرقام FID القياسية في التوليد المشروط من 14.73 إلى 11.48 على CIFAR-10، ومن 8.73 إلى 6.66 على ImageNet-2012.