إكمال الصور على نطاق واسع من خلال الشبكات التوليدية المتنافسة المُنظَّمة تفاعليًا

تم تطوير العديد من المتغيرات المخصصة للمهام الخاصة بشبكات التوليد المتنافسة الشرطية (Conditional Generative Adversarial Networks) لمعالجة الصور المفقودة. ومع ذلك، ما يزال هناك عيب جوهري يتمثل في فشل جميع الخوارزميات الحالية عند التعامل مع مناطق مفقودة كبيرة الحجم. ولتجاوز هذا التحدي، نقترح منهجًا جديدًا عامًا يُمكّن من سد الفجوة بين الهياكل التوليدية الشرطية والهياكل التوليدية غير الشرطية الحديثة من خلال عملية التحكم المزدوج (co-modulation) في كلا تمثيلات الأسلوب الشرطي والاحتمالي. بالإضافة إلى ذلك، وبسبب نقص مقاييس كمية جيدة لتقدير أداء إعادة تكوين الصور، نقترح مؤشرًا جديدًا يُسمى "مؤشر التمييز المتماثل/غير المتماثل لإنسيبشن" (Paired/Unpaired Inception Discriminative Score - P-IDS/U-IDS)، والذي يقيس بدقة موثوقة وضوح الصور المُعاد تكوينها من حيث الإدراك مقارنة بالصور الحقيقية، وذلك من خلال قابلية الفصل الخطي في فضاء الميزات. تُظهر التجارب أداءً متفوقًا من حيث الجودة والتنوع مقارنة بالأساليب الرائدة في مجال إعادة تكوين الصور ذات الأشكال الحرة، كما تُظهر القدرة على التعميم السهل على مهام تحويل الصور إلى صور. يمكن الوصول إلى الكود عبر الرابط: https://github.com/zsyzzsoft/co-mod-gan.