شبكات توليدية متعارضة ذات مُميّزَين مزدوجين

في هذه الورقة، نقترح نهجًا جديدًا لمعالجة مشكلة الانهيار النمطي (Mode Collapse) التي تواجهها الشبكات التوليدية التنافسية (GAN). تتمحور أفكارنا حول فكرة بديهية لكنها أثبتت فعاليتها بشكل كبير، خصوصًا في التصدي لبعض القيود الأساسية للـ GAN. بشكل أساسي، يُدمج هذا النهج مفهومي التباعد الإنتروبي (Kullback-Leibler) والتباعد العكسي (Reverse KL) في دالة هدف موحدة، مما يسمح باستغلال الخصائص الإحصائية المكملة الناتجة عن هذين التباعدَين، وبالتالي تنويع كثافة التقدير بشكل فعّال عند التقاط التوزيعات متعددة النماذج. نُسمّي هذا الأسلوب "الشبكات التوليدية التنافسية ذات المُصنّف المزدوج" (D2GAN)، والذي يختلف عن الـ GAN التقليدي من حيث امتلاكه لمحرّقَين (Discriminators) بدلًا من واحد فقط؛ ومع وجود المولّد (Generator)، يتشابه النظام في طبيعته مع لعبة ماكسيموم-مينيموم (Minimax Game)، حيث يُكافئ أحد المُصنّفين العينات المشتقة من توزيع البيانات بدرجات عالية، في حين يُفضّل الآخر العينات الناتجة عن المولّد، ويُحاول المولّد إنتاج بيانات تخدع كلا المُصنّفين. قمنا بتطوير تحليل نظري يُبيّن أن، مع افتراض أن المُصنّفين في أقصى كفاءة، فإن تحسين المولّد في D2GAN يُعادل تقليل كل من تباعد KL وتباعد KL العكسي بين توزيع البيانات الحقيقي وتوزيع البيانات الناتجة عن المولّد، وبالتالي يُقلل بشكل فعّال من مشكلة الانهيار النمطي. أجرينا تجارب واسعة على مجموعات بيانات مصطنعة وواقعية كبيرة الحجم (MNIST، CIFAR-10، STL-10، ImageNet)، حيث بذلنا قصارى جهدنا لمقارنة D2GAN مع أحدث النماذج المتطورة من الـ GAN من حيث التقييم النوعي والكمي الشامل. تُظهر نتائج التجارب أداءً متميزًا ومقابلًا لأساليب المقارنة، من حيث جودة العينات المولّدة وتنوعها، بالإضافة إلى قدرة طريقة D2GAN على التوسع لدعم قاعدة بيانات ImageNet.