استرجاع صورة فردية موجهة بالاستشعار باستخدام تقدير الهدف الأمثل

توفر شبكات التكبير الفردي للصورة (SISR) التي تم تدريبها باستخدام خسائر التوصيف والخسائر المضادة نتائج ذات تباين عالٍ مقارنةً بالشبكات التي تم تدريبها باستخدام خسائر موجهة نحو التشوه، مثل L1 أو L2. ومع ذلك، أظهرت الدراسات أن استخدام خسارة توصيفية واحدة فقط لا يكفي لاستعادة بدقة الأشكال المتنوعة المتغيرة محليًا في الصور، حيث تؤدي غالبًا إلى توليد عيوب غير مرغوب فيها أو تفاصيل غير طبيعية. ولذلك، تم محاولة استخدام مزيج من خسائر متنوعة، مثل الخسائر التوصيفية والمضادة والتشوهية، لكن لا يزال من الصعب العثور على المزيج الأمثل. ولهذا السبب، نقترح في هذا البحث إطارًا جديدًا لـ SISR يطبّق الأهداف المثلى لكل منطقة لإنتاج نتائج واقعية في جميع أنحاء الصور عالية الدقة الناتجة. بشكل محدد، يتكون الإطار من نموذجين: نموذج تنبؤي يُقدّر خريطة هدف مثلى لصورة منخفضة الدقة (LR) معطاة، ونموذج توليدي يطبّق خريطة هدف مستهدفة لإنتاج الصورة عالية الدقة (SR) المقابلة. يتم تدريب النموذج التوليدي على مسار هدف اقترحه الباحثون، يمثل مجموعة من الأهداف الأساسية، مما يمكّن الشبكة الواحدة من تعلّم نتائج متعددة لـ SR تتوافق مع خسائر مجمعة على هذا المسار. ويتم تدريب النموذج التنبؤي باستخدام أزواج من الصور منخفضة الدقة وخريطة الأهداف المثلى المُستخرَجة من مسار الهدف. أظهرت النتائج التجريبية على خمسة معايير معيارية أن الطريقة المقترحة تتفوّق على أحدث الطرق المُعتمدة على التوصيف في مقاييس LPIPS وDISTS وPSNR وSSIM. كما تُظهر النتائج البصرية تفوق طريقة الباحثين في إعادة البناء المُوجه نحو التوصيف. يُمكن الوصول إلى الكود والنماذج عبر الرابط التالي: https://github.com/seungho-snu/SROOE.