توسيع وتصغير الصور القابل للعكس

الصور الرقمية ذات الدقة العالية غالبًا ما يتم تقليل دقتها لتتوافق مع شاشات العرض المختلفة أو لتوفير تكلفة التخزين والبنية التحتية للشبكة، بينما يتم استخدام عملية إعادة زيادة الدقة بعد ذلك لاستعادة الدقة الأصلية أو التفاصيل في الصور المكبرة. ومع ذلك، فإن تقليص الصورة النموذجي هو تعيين غير مُحقِّقٍ للحقائق (non-injective mapping) بسبب فقدان المعلومات ذات التردد العالي، مما يؤدي إلى مشكلة عكسية غير محددة جيدًا (ill-posed problem) في إجراء إعادة زيادة الدقة ويشكل تحديات كبيرة لاستعادة التفاصيل من الصور ذات الدقة المنخفضة التي تم تقليصها. ببساطة، استخدام طرق زيادة الدقة الفائقة للصور لا ينتج أداءً راضيًا في استعادة التفاصيل. في هذا العمل، نقترح حل هذه المشكلة من خلال نمذجة عمليات التقليص وإعادة الزيادة من وجهة نظر جديدة، وهي تحويل قابل للعكس ومُحقِّقٌ للحقائق (invertible bijective transformation)، مما يمكن من تخفيف الطبيعة غير المحددة جيدًا لإعادة زيادة دقة الصور بشكل كبير. لقد طوَّرنا شبكة إعادة التحجيم القابلة للعكس (Invertible Rescaling Net - IRN) باستخدام إطار عمل وأهداف مصممة بعناية لإنتاج صور ذات دقة منخفضة مقبولة بصريًا وفي الوقت نفسه التقاط توزيع المعلومات المفقودة باستخدام متغير كامن يتبع توزيعًا محددًا في عملية التقليص. بهذه الطريقة، يتم جعل عملية إعادة الزيادة قابلة للتنفيذ عن طريق مرور متغير كامن عشوائي مع صورة ذات دقة منخفضة عبر الشبكة بشكل عكسي. تظهر النتائج التجريبية التحسين الكبير الذي حققه نموذجنا على الأساليب الموجودة فيما يتعلق بتقييمات الصور المكبرة كمياً ونوعيًا من الصور التي تم تقليصها.