إعادة تشغيل ACGAN: نماذج GAN المُصنّفة المساعدة مع تدريب مستقر

تُولِّد الشبكات التوليدية التنافسية الشرطية (cGAN) صورًا واقعية من خلال دمج معلومات الفئة في الشبكة التوليدية. وعلى الرغم من أن أحد أكثر نماذج cGAN شيوعًا هو الشبكة التوليدية التنافسية المُصنفة المساعدة ذات خسارة التفاضل العشوائي للدالة الأسية (ACGAN)، إلا أن من المعروف على نطاق واسع أن تدريب ACGAN يُعد تحديًا كبيرًا مع زيادة عدد الفئات في مجموعة البيانات. كما أن ACGAN تميل إلى إنتاج عينات سهلة التصنيف، مع نقص في التنوّع. في هذه الورقة، نقدّم حلَّين لمشكلات ACGAN. أولاً، نحدد أن انفجار التدرج في المصنّف يمكن أن يؤدي إلى انهيار غير مرغوب فيه في المراحل المبكرة من التدريب، وأن إسقاط المتجهات المدخلة على كرة وحدة عالية الأبعاد يمكن أن يحل هذه المشكلة. ثانيًا، نقترح خسارة التفاضل العشوائي من نوع "من البيانات إلى البيانات" (D2D-CE) للاستفادة من المعلومات الترابطية في مجموعة البيانات المصنفة فئات. بناءً على هذا الأساس، نقدّم الشبكة التوليدية التنافسية المُصنفة المساعدة المعاد تفعيلها (ReACGAN). أظهرت النتائج التجريبية أن ReACGAN تحقق أفضل نتائج توليد حاليًا على مجموعات بيانات CIFAR10 وTiny-ImageNet وCUB200 وImageNet. كما تأكد أن ReACGAN يستفيد من التحويلات القابلة للتفاضل، وأن خسارة D2D-CE تتماشى جيدًا مع معمارية StyleGAN2. تم توفير أوزان النموذج وحزمة برمجية تقدم تنفيذًا لنموذج cGAN الممثلة والتجارب كافة المذكورة في هذه الورقة عبر الرابط: https://github.com/POSTECH-CVLab/PyTorch-StudioGAN.