توليد الكائنات بكفاءة في البيانات من التمييز بين الكائنات

لقد حققت الشبكات التوليدية المتنافسة (GANs) تقدماً كبيراً في توليد الصور، إلا أن جودة التوليد تنخفض بشكل ملحوظ عند توفر كمية محدودة من بيانات التدريب. ولتحسين كفاءة استخدام البيانات في تدريب GANs، يعتمد العمل السابق عادةً على تكبير البيانات (data augmentation) لتقليل انتقال التعلم الزائد (overfitting) للتمييز (discriminator)، مع الاستمرار في تدريبه على مهمة تصنيف ثنائي الفئة (أي: صورة حقيقية مقابل صورة مزيفة). في هذا العمل، نقترح منهجية فعّالة من حيث استخدام البيانات تُسمى توليد المثيلات (InsGen) تعتمد على تمييز المثيلات (instance discrimination). وبشكل محدد، وبالإضافة إلى التمييز بين المجال الحقيقي والمجال المزيف، يُطلب من المُميّز تمييز كل صورة فردية، بغض النظر عما إذا كانت من مجموعة التدريب أو من المولّد (generator). وبهذه الطريقة، يمكن للمُميّز الاستفادة من عدد لا نهائي من العينات المولّدة للتدريب، مما يخفف من مشكلة الانتقال الزائد الناتجة عن نقص بيانات التدريب. كما نُدخل استراتيجية تضخم الضوضاء (noise perturbation) لتحسين قدرته التمييزية. وفي الوقت نفسه، تُستغل القدرة المُكتسبة من التمييز المثيلي في المُميّز لتشجيع المولّد على إنتاج تنوع كبير في الصور المولّدة. تُظهر التجارب الواسعة فعالية منهجيتنا على مجموعة متنوعة من مجموعات البيانات والبيئات التدريبية. وبشكل لافت، في حالة استخدام 2000 صورة تدريب من مجموعة بيانات FFHQ، نتفوّق على أحدث الطرق بتحسين قدره 23.5% في معيار FID.