توليد صور وجوه منخفضة الدقة جدًا غير متماثلة ومشوهة بواسطة مُشفّرات تلقائية تمييزية تحويلية
توليد صور وجوه منخفضة الدقة جدًا غير متماثلة ومشوهة بواسطة مُشفّرات تلقائية تمييزية تحويلية
{Xin Yu Fatih Porikli}

الملخص
تعتبر معظم الطرق التقليدية لتحسين الوجه (Face Hallucination) افتراضًا أن الصورة المدخلة كبيرة بدرجة كافية ومُحاذاة، كما تتطلب جميعها أن تكون الصورة المدخلة خالية من الضوضاء. وتتدهور أداؤها بشكل كبير إذا كانت الصورة المدخلة صغيرة جدًا، غير مُحاذاة، ومحفوفة بالضوضاء. في هذه الورقة، نقدم نموذجًا جديدًا يُسمى "المحوّل التمييزي الآلي التلقائي" (Transformative Discriminative Autoencoder) قادراً على تحسين دقة الصورة بعامل 8 مرات (8X) لصور الوجه منخفضة الدقة التي تكون صغيرة جدًا (16×16) وغير مُحاذاة ومحفوفة بالضوضاء. على عكس النماذج التقليدية القائمة على هيكل المُشفِّر-المُفكِّك (Encoder-Decoder)، يعتمد نهجنا على شبكة مُفكِّك-مُشفِّر-مُفكِّك (Decoder-Encoder-Decoder). نستخدم أولًا شبكة مُفكِّك تمييزي مُحوّل لزيادة حجم الصورة وتنقيتها من الضوضاء في آنٍ واحد. ثم نستخدم شبكة مُشفِّر مُحوّل لتحويل الوجوه عالية الدقة الوسيطة إلى صور منخفضة الدقة مُحاذاة وخالية من الضوضاء. وأخيرًا، نستخدم المُفكِّك الثاني لإنتاج صور عالية الدقة مُخَيَّلَة (Hallucinated). تُظهر التقييمات الواسعة التي أجريناها على مجموعة بيانات ضخمة جدًا للوجوه أن نهجنا يحقق نتائج متميزة في تحسين الوجه، ويتفوق على أحدث الطرق العلمية بفارق كبير يبلغ 1.82 ديسيبل في معيار PSNR.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| image-super-resolution-on-vggface2-8x | TDAE | PSNR: 20.19 |
| image-super-resolution-on-webface-8x | TDAE | PSNR: 20.24 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.