DuelGAN: معركة بين مُميّزَين تُثبّت تدريب GAN

في هذه الورقة، نقدّم DuelGAN، وهو حل يعتمد على الشبكات التوليدية التنافسية (GAN) بهدف تحسين استقرار العينات المولّدة والتقليل من مشكلة الانهيار النمطي (mode collapse). مبنيًا على لعبة اللاعبين المتعارضين في GAN التقليدي بين المُميّز $D_1$ والمحوّل $G$، نُضيف إلى لعبة المين-ماكس مُميّزًا ثانويًا يُسمّى $D_2$. تمامًا كما في الدراسات السابقة التي تستخدم مُميّزين اثنين، يُعدّ الدور الأول لكليهما $D_1$ و$D_2$ هو التمييز بين العينات المولّدة والعينات الحقيقية، بينما يسعى المحول إلى إنتاج عينات عالية الجودة قادرة على خداع كلا المُميّزين. على عكس الأساليب الحالية، نُدخل لعبة إضافية بين $D_1$ و$D_2$ لتشجيع التباين بينهما وتقليل اتفاقهما، وبالتالي زيادة تنوع العينات المولّدة. ويُعدّ هذا الميزة مفيدة في تخفيف مشكلة الانهيار النمطي المبكر، حيث تمنع لعبة $D_1$ و$D_2$ من الاقتراب السريع من التقارب. نقدّم تحليلًا نظريًا لاستقرار نقطة التوازن في لعبة المين-ماك스 التي تتشكل بين $G$ و$D_1$ و$D_2$، كما نقدّم تحليلًا لسلوك التقارب واستقرار لعبة المين-ماك스. ومن المهم الإشارة إلى أن DuelGAN يعمل في بيئة غير مُشرّفة، ولا يحتاج إلى أي توجيه بالعلامات في لعبة التحدي بين $D_1$ و$D_2$. وأظهرت نتائج التجارب على مجموعة بيانات اصطناعية وعلى مجموعات بيانات صور واقعية (MNIST، Fashion MNIST، CIFAR-10، STL-10، CelebA، VGG، وFFHQ) أن DuelGAN يتفوّق على الطرق الأساسية التنافسية في إنتاج عينات متنوعة وعالية الجودة، مع إدخال تكلفة حسابية ضئيلة جدًا.