HyperAIHyperAI
منذ 8 أيام

تقدير نواة المستوى البكسلية للتحسين الأعمى للصورة

{Jae-Pil Heo, Euiyeon Kim, Jaihyun Lew}
الملخص

على مدار السنوات القليلة الماضية، حققت النماذج القائمة على التعلم العميق نجاحًا كبيرًا في مجال التكبير الخطي (Super-Resolution - SR). وغالبًا ما تفترض هذه الدراسات أن الصور منخفضة الدقة (LR) تخضع لتشويه "متجانس" من صورها المرجعية عالية الدقة (HR) باستخدام نوى تشويه محددة مسبقًا — حيث تخضع جميع مناطق الصورة لنفس عملية التدهور. وبالإضافة إلى ذلك، استندت العديد من المحاولات إلى هذه الافتراضية لتقدير نواة التشويه الخاصة بصورة منخفضة الدقة معينة، نظرًا لكون معرفة نواة التشويه الصحيحة تُعد مفيدة جدًا في تحسين جودة التكبير. وعلى الرغم من أن من المعروف أن نوى التشويه في الصور الحقيقية ليست متجانسة (أي متغيرة مكانيًا)، إلا أن الخوارزميات الحالية لتقدير النوى تُطبَّق غالبًا على مستوى الصورة بأكملها، حيث يتم تقدير نواة واحدة لكل صورة. وتؤدي هذه الطريقة إلى أداء غير مثالي في الحالات التي تتعرض فيها الصورة لتشويه غير متجانس. وقد يُنظر إلى نهج "التقسيم والسيطرة" (divide-and-conquer)، من خلال تقسيم الصورة إلى عدة مساحات صغيرة (patches) لتقدير النوى وتنفيذ التكبير بشكل منفصل لكل منها، كحل بسيط لهذا التحدي. ولكن في الواقع، يفشل هذا النهج عمليًا. في هذه الورقة، نعالج هذه المشكلة من خلال تقدير نواة التشويه على مستوى البكسل (pixel-level kernel estimation). وتتمثل المكونات الثلاثة الرئيسية لتدريب إطار عمل للتكبير الخطي يعتمد على تقدير النواة على مستوى البكسل في الآتي:1. تركيب النوى (Kernel Collage): طريقة لتصنيع صور منخفضة الدقة متشوهة غير متجانسة، صُممت مع مراعاة التماسك بين نوى التشويه في المناطق المجاورة، مع السماح بتغيرات مفاجئة في بعض الأحيان.2. الخسارة غير المباشرة (Indirect Loss): خسارة جديدة لتدريب مُقدِّر النوى، تعتمد على خسارة إعادة البناء (reconstruction loss).3. تحسين إضافي (Additional Optimization): نموذج لجعل شبكة التكبير أكثر مقاومة لأخطاء صغيرة في تقدير النوى. أظهرت التجارب الواسعة تفوق تقدير النواة على مستوى البكسل في حالات التكبير غير المُعرف (blind SR)، حيث تفوقت على أحدث الطرق من حيث النتائج الكمية والكيفية.

تقدير نواة المستوى البكسلية للتحسين الأعمى للصورة | أحدث الأوراق البحثية | HyperAI