HyperAIHyperAI
منذ 18 أيام

تقدير خوارزمية التكبير الأعمى باستخدام GAN داخلي

Sefi Bell-Kligler, Assaf Shocher, Michal Irani
تقدير خوارزمية التكبير الأعمى باستخدام GAN داخلي
الملخص

تُفترض في طرق التكبير الفائق (SR) عادةً أن الصورة منخفضة الدقة (LR) تم تقليل حجمها من صورة عالية الدقة غير معروفة (HR) باستخدام نواة تقليل حجم ثابتة و"مثالية" (مثل نواة التقليل بالانسيابية الثنائية - Bicubic). ومع ذلك، فإن هذا الافتراض نادرًا ما يتحقق في الصور الحقيقية منخفضة الدقة، على عكس مجموعات البيانات المُولَّدة اصطناعيًا لتطبيقات التكبير الفائق. عندما تختلف النواة المفترضة عن النواة الحقيقية، تنخفض أداء طرق التكبير الفائق بشكل كبير. وقد نتج عن ذلك ظهور ما يُعرف بـ "التكبير العشوائي" (Blind-SR)، أي التكبير الفائق عندما تكون نواة التقليل (التي نسمّيها "نواة التكبير" - SR-kernel) غير معروفة. وقد أُظهر لاحقًا أن النواة الحقيقية لـ SR هي تلك التي تُعظم تكرار المربعات (patches) عبر المقياس في الصورة منخفضة الدقة. في هذه الورقة، نُظهر كيف يمكن تحقيق هذه الخاصية القوية للتكرار عبر المقياس باستخدام تقنية التعلم الداخلي العميق (Deep Internal Learning). نقدّم "KernelGAN"، وهو نموذج GAN داخلي مخصص للصورة، يتم تدريبه حصريًا على الصورة منخفضة الدقة المستهدفة في وقت الاختبار، ويتعلم التوزيع الداخلي للمربعات فيها. يتم تدريب المُولِّد (Generator) لإنتاج نسخة مُقلّصة من الصورة منخفضة الدقة المستهدفة، بحيث لا يتمكن المُميّز (Discriminator) من التمييز بين توزيع المربعات في الصورة المُقلّصة وتوزيع المربعات في الصورة الأصلية منخفضة الدقة. بمجرد اكتمال التدريب، يُمثّل المُولِّد العمليّة التقليلية باستخدام نواة التكبير الصحيحة المخصصة للصورة. يتميز KernelGAN بأنه كامل التعلّم غير المُراقب، ولا يحتاج إلى بيانات تدريب إضافية سوى الصورة المدخلة نفسها، ويُحقّق نتائج رائدة في مجال Blind-SR عند دمجه في خوارزميات التكبير الفائق الحالية.