تحسين خفيف للصورة فائقة الدقة باستخدام شبكة تجميع المعلومات متعددة

في السنوات الأخيرة، حققت الطرق المستندة إلى الشبكات العصبية العميقة ذات التحويل التوافقي (CNN) لتحسين دقة الصورة الفردية (SISR) نتائج ملحوظة. وبفضل القدرة القوية على التمثيل التي تمتلكها الشبكات العميقة، تمكنت العديد من الطرق السابقة من تعلم العلاقة غير الخطية المعقدة بين كتل الصور منخفضة الدقة (LR) ونسخها عالية الدقة (HR). ومع ذلك، فإن التحويلات التوافقية الزائدة تُحد من تطبيق تقنية التحسين في الأجهزة ذات القدرة الحسابية المنخفضة. علاوةً على ذلك، يظل التحسين إلى أي عامل مقياس عشوائي أمرًا بالغ الأهمية في التطبيقات العملية، ولم تُحل هذه المشكلة بشكل جيد في الطرق السابقة. لمعالجة هذه التحديات، نقترح شبكة خفيفة الوزن تُسمى "الشبكة المتعددة التقطير للمعلومات" (IMDN)، من خلال بناء كتل متسلسلة تُسمى "الكُتل المتعددة التقطير للمعلومات" (IMDB)، والتي تتضمن جزأين: التقطير والدمج المُختار. بشكل محدد، يستخرج الوحدة التقطيرية الميزات الهرمية خطوة بخطوة، بينما تقوم الوحدة الدموية بتجميع هذه الميزات وفقًا لأهمية الميزات المرشحة، حيث تُقيَّم هذه الأهمية بواسطة آلية انتباه القناة المستندة إلى التباين، التي تم اقتراحها في هذا العمل. ولمعالجة الصور الحقيقية بأحجام مختلفة، طوّرنا استراتيجية قص تلقائية (ACS) لتحسين دقة كتل الصور بشكل متسلسل باستخدام نموذج مُدرّب جيدًا واحدًا. تُظهر التجارب الواسعة أن الطريقة المقترحة تتفوق على أحدث خوارزميات التحسين من حيث الجودة البصرية، وحجم استهلاك الذاكرة، ووقت الاستدلال. يمكن الوصول إلى الكود من خلال الرابط التالي: \url{https://github.com/Zheng222/IMDN}.