المرجعية القائمة على الصور ذات الدقة العالية باستخدام محول الانتباه القابل للتشويه

الصورة ذات الدقة العالية بالاستناد إلى مرجع (RefSR) تهدف إلى استغلال الصور المرجعية المساعدة (Ref) لزيادة دقة الصور ذات الدقة المنخفضة (LR). في الآونة الأخيرة، اجتذبت تقنية RefSR اهتمامًا كبيرًا حيث توفر طريقة بديلة لتجاوز تقنية زيادة الدقة للصورة الواحدة (Single Image SR). ومع ذلك، فإن معالجة مشكلة RefSR تواجه تحديين حاسمين: (i) من الصعب مطابقة التوافق بين الصور ذات الدقة المنخفضة والصور المرجعية عندما تكون هناك اختلافات كبيرة بينهما؛ (ii) كيفية نقل النسيج المناسب من الصور المرجعية لتعويض التفاصيل في الصور ذات الدقة المنخفضة هو تحدي صعب للغاية. لمعالجة هذه القضايا المتعلقة بتقنية RefSR، يقترح هذا البحث محول انتباه قابل للتشوه متعدد المقاييس، يُطلق عليه اسم DATSR، يتكون كل مقاس فيه من وحدة كودر خصائص النسيج (TFE)، ووحدة انتباه قابل للتشوه بالاستناد إلى مرجع (RDA)، ووحدة تجميع الخصائص المتبقية (RFA). بشكل خاص، تقوم وحدة TFE أولاً باستخراج الخصائص غير الحساسة للتغيرات في الصورة (مثل السطوع) لكل من الصور ذات الدقة المنخفضة والصور المرجعية. ثم يمكن لوحدة RDA استغلال العديد من النساجات المناسبة لتعويض المزيد من المعلومات للخصائص ذات الدقة المنخفضة. وأخيراً، تقوم وحدة RFA بتجميع الخصائص ذات الدقة المنخفضة والنساجات المناسبة للحصول على نتيجة أكثر جاذبية بصرياً. تظهر التجارب الواسعة أن محول الانتباه القابل للتشوه الذي نقترحه (DATSR) يحقق أفضل الأداء على مجموعة بيانات المعايير الكمية والنوعية.