HyperAIHyperAI
منذ 17 أيام

CLR-GAN: تحسين استقرار ونوعية نماذج GAN من خلال تمثيلات متجهة متسقة وإعادة بناء

{Shijie Luo and Shuzhen Han, Zhanshan Zhao, Ziqian Luan, Shengke Sun}
الملخص

حصلت الشبكات التوليدية المتنافسة (GANs) على اهتمام كبير بفضل قدرتها المتميزة على توليد الصور. ومع ذلك، فإن تدريب GAN صعب نظرًا لعدم تكافؤ اللعبة بين المولّد (G) والمحكم (D). ولجعل هذه المنافسة أكثر عدالة، نقترح منظورًا جديدًا لتدريب GAN، يُسمى "تمثيل متجانس للمساحة المخفية وإعادة بناء" (CLR-GAN). في هذا النموذج، ننظر إلى المولّد والمحكم على أنهما عملية عكسية، حيث يُكلف المحكم بمهام إضافية لإعادة بناء الرمز المخفي المُعرّف مسبقًا، في حين يجب على المولّد أيضًا إعادة بناء الإدخال الحقيقي، مما يُمكّن من استخلاص علاقة بين الفضاء المخفي للمولّد والسمات الخارجة من المحكم. وباستناد إلى هذا المعرفة المسبقة، يمكننا وضع المحكم والمولّد في موقف متساوٍ أثناء التدريب باستخدام معيار جديد. أثبتت النتائج التجريبية على مجموعة بيانات ومعماريات متنوعة أن هذا النموذج يُعزز استقرار GAN ويُنتج صورًا ذات جودة أعلى (بزيادة قدرها 31.22% في مؤشر FID على CIFAR10 و39.5% على AFHQ-Cat على التوالي). ونأمل أن يُلهم هذا المنظور الباحثين على استكشاف طرق مختلفة لفهم تدريب GAN، بدلًا من الاقتصار على نموذج اللعبة الثنائية. يمكن الوصول إلى الكود المصدري بشكل عام عبر الرابط: https://github.com/Petecheco/CLR-GAN.