التصحيح الدقيق للصور

تقنيات تكميل الصور (Image Inpainting) قد أظهرت تحسينًا واعدًا مؤخرًا بفضل المساعدة التي تقدمها الشبكات المضادة التوليدية (Generative Adversarial Networks - GANs). ومع ذلك، غالبية هذه التقنيات كانت تعاني غالبًا من نتائج مكتملة ذات بنية غير معقولة أو ضبابية. لحل هذه المشكلة، نقدم في هذا البحث نموذجًا واحدًا المرحلة يستخدم تركيبات كثيفة للتحويلات الموسعة (Dilated Convolutions) للحصول على حقول استقبال أكبر وأكثر فعالية. بفضل خصائص هذه الشبكة، يمكننا استعادة المناطق الكبيرة في الصورة الناقصة بشكل أسهل. لتدريب هذا المولد الفعال بشكل أفضل، بالإضافة إلى الخسارة المتكررة لمطابقة ميزات VGG، قمنا بتصميم خسارة انحدار ذاتية جديدة تركز على المناطق الغير مؤكدة وتعزز التفاصيل الدلالية. علاوة على ذلك، وضعنا عنصر قيد جديد يعتمد على التناسق الهندسي لتعويض المسافة القائمة على البكسل بين ميزات التنبؤ والميزات الحقيقية. كما استخدمنا مميزًا (Discriminator) ذو فروع محلية وعالمية لضمان التناسق بين المحتوى المحلي والعالمي. لتحسين جودة الصور المنتجة بشكل أكبر، تم تقديم مطابقة ميزات المميز في الفرع المحلي، والتي تقوم بتقليل التشابه بين ميزات الوسط في الأجزاء الاصطناعية والأجزاء الحقيقية بشكل ديناميكي. أثبتت التجارب الواسعة على عدة قواعد بيانات عامة أن نهجنا يتفوق على الأساليب الأكثر تقدمًا حاليًا. يمكن الحصول على الرمز البرمجي من الرابط التالي: https://github.com/Zheng222/DMFN.