توليد صور وجوه منخفضة الدقة جدًا غير متماثلة ومشوهة بواسطة مُشفّرات تلقائية تمييزية تحويلية

تعتبر معظم الطرق التقليدية لتحسين الوجه (Face Hallucination) افتراضًا أن الصورة المدخلة كبيرة بدرجة كافية ومُحاذاة، كما تتطلب جميعها أن تكون الصورة المدخلة خالية من الضوضاء. وتتدهور أداؤها بشكل كبير إذا كانت الصورة المدخلة صغيرة جدًا، غير مُحاذاة، ومحفوفة بالضوضاء. في هذه الورقة، نقدم نموذجًا جديدًا يُسمى "المحوّل التمييزي الآلي التلقائي" (Transformative Discriminative Autoencoder) قادراً على تحسين دقة الصورة بعامل 8 مرات (8X) لصور الوجه منخفضة الدقة التي تكون صغيرة جدًا (16×16) وغير مُحاذاة ومحفوفة بالضوضاء. على عكس النماذج التقليدية القائمة على هيكل المُشفِّر-المُفكِّك (Encoder-Decoder)، يعتمد نهجنا على شبكة مُفكِّك-مُشفِّر-مُفكِّك (Decoder-Encoder-Decoder). نستخدم أولًا شبكة مُفكِّك تمييزي مُحوّل لزيادة حجم الصورة وتنقيتها من الضوضاء في آنٍ واحد. ثم نستخدم شبكة مُشفِّر مُحوّل لتحويل الوجوه عالية الدقة الوسيطة إلى صور منخفضة الدقة مُحاذاة وخالية من الضوضاء. وأخيرًا، نستخدم المُفكِّك الثاني لإنتاج صور عالية الدقة مُخَيَّلَة (Hallucinated). تُظهر التقييمات الواسعة التي أجريناها على مجموعة بيانات ضخمة جدًا للوجوه أن نهجنا يحقق نتائج متميزة في تحسين الوجه، ويتفوق على أحدث الطرق العلمية بفارق كبير يبلغ 1.82 ديسيبل في معيار PSNR.