النمو التدريجي للشبكات المولدة المتنافسة (GANs) لتحسين الجودة والاستقرار والتنوع

نقدم منهجية تدريب جديدة للشبكات العصبية المولدة المعادية (Generative Adversarial Networks). الفكرة الأساسية هي توسيع كل من المولد والتمييز تدريجيًا: نبدأ بدقة منخفضة، ثم نضيف طبقات جديدة تُمثِّل تفاصيل أدق مع تقدُّم التدريب. هذا يسرِّع عملية التدريب ويجعلها أكثر استقرارًا، مما يتيح لنا إنتاج صور ذات جودة غير مسبوقة، مثل صور CelebA بحجم 1024×1024. كما نقترح طريقة بسيطة لزيادة التنوع في الصور المولدة، ونحقق درجة ابتداع قياسية بلغت 8.80 في مجموعة بيانات CIFAR10 بدون إشراف. بالإضافة إلى ذلك، نصف عدة تفاصيل تنفيذية مهمة لمنع المنافسة غير الصحية بين المولد والتمييز. وأخيرًا، نقترح مؤشرًا جديدًا لتقييم نتائج الشبكات العصبية المولدة المعادية (GAN)، سواءً من حيث جودة الصورة أو التنوع فيها. كمساهمة إضافية، قمنا بإنشاء إصدار أعلى جودة لمجموعة بيانات CelebA.