SRFlow: تعلّم فضاء التكبير الفائق باستخدام التدفق المعياري

الاسترجاع الفائق للدقة (Super-resolution) يُعد مشكلة غير محددة جيدًا (ill-posed problem)، نظرًا لأنه يسمح بتوليد تنبؤات متعددة لصورة منخفضة الدقة معينة. ورغم هذا الواقع الأساسي، فإن معظم الطرق الحديثة القائمة على التعلم العميق تتجاهل هذه الحقيقة. إذ تُدرّب هذه الأساليب بشكل محدد (deterministic) من خلال دمج بين خسائر إعادة البناء (reconstruction losses) وخصائص المواجهة (adversarial losses). في هذا العمل، نقترح إذًا SRFlow: طريقة قائمة على التدفق الطبيعي (normalizing flow) لاسترجاع الدقة الفائقة، قادرة على تعلم التوزيع الشرطي للناتج بناءً على المدخل منخفض الدقة. يتم تدريب نموذجنا بطريقة منهجية باستخدام خسارة واحدة فقط، وهي سلبي اللوغاريتم الاحتمالي (negative log-likelihood). وبهذا، يأخذ SRFlow بعين الاعتبار بشكل مباشر طبيعة المشكلة غير المحددة جيدًا، ويتعلم توليد صور عالية الدقة متنوعة وواقعية بصريًا. علاوةً على ذلك، نستفيد من التوزيع الاحتمالي القوي للصورة الذي يتعلمه SRFlow لتصميم تقنيات مرنة للتعديل على الصور، تتيح تحسين الصور المسترجعة من خلال تقنيات مثل نقل المحتوى من صور أخرى. أجرينا تجارب واسعة على الوجوه، بالإضافة إلى تجارب عامة في استرجاع الدقة الفائقة. وقد أظهر SRFlow تفوقًا على أحدث الطرق القائمة على GAN من حيث مقاييس PSNR والجودة الواعية (perceptual quality)، مع القدرة على توفير تنوع من خلال استكشاف فضاء الحلول المسترجعة للدقة الفائقة.