HyperAIHyperAI
منذ 17 أيام

نهج واحد إلى كثير لتحسين التكبير الفائق

Sieun Park, Eunho Lee
نهج واحد إلى كثير لتحسين التكبير الفائق
الملخص

في الآونة الأخيرة، ظهرت مناقشات حول الطبيعة غير المحددة (ill-posed) لعملية تحسين الدقة (super-resolution)، حيث توجد عدة إمكانات لإعادة بناء صورة منخفضة الدقة (low-resolution) واحدة. وباستخدام تدفقات التطبيع (normalizing flows)، تحقّق SRflow[23] أفضل جودة إدراكية (perceptual quality) على مستوى الحد الأقصى من خلال تعلّم توزيع الصور الناتجة، بدلًا من التوجه نحو نتيجة محددة واحدة. في هذه الورقة، نُعدّل مفاهيم SRflow لتحسين تحسين الدقة القائم على GAN من خلال تنفيذ مناسب لخاصية "واحد إلى كثير" (one-to-many). نُعدّل المُولّد (generator) ليقدّر توزيعًا كدالة تُحول الضوضاء العشوائية إلى صور. كما نُحسّن خسارة المحتوى (content loss) التي تُعيق أهداف التدريب الإدراكي. بالإضافة إلى ذلك، نقترح تقنيات تدريب إضافية لتعزيز جودة الصور الناتجة من حيث الإدراكية. وباستخدام الطرق المقترحة، نجحنا في تحسين أداء ESRGAN[1] في تحسين الدقة الإدراكي (perceptual SR) بمعامل 4، وتحقيق أفضل نتيجة مُسجّلة من حيث مؤشر LPIPS في تحسين الدقة الإدراكي المتطرّف (extreme SR) بمعامل 16، وذلك من خلال تطبيق طرقنا على RFB-ESRGAN[21].

نهج واحد إلى كثير لتحسين التكبير الفائق | أحدث الأوراق البحثية | HyperAI