HyperAIHyperAI
منذ 3 أشهر

مانيا: شبكة انتباه متعددة الأبعاد لتقييم جودة الصورة بدون مرجع

Sidi Yang, Tianhe Wu, Shuwei Shi, Shanshan Lao, Yuan Gong, Mingdeng Cao, Jiahao Wang, Yujiu Yang
مانيا: شبكة انتباه متعددة الأبعاد لتقييم جودة الصورة بدون مرجع
الملخص

تقييم جودة الصور بدون مرجع (NR-IQA) يهدف إلى تقييم جودة الصور من حيث الإدراك البشري، وفقًا للإدراك الموضوعي للإنسان. وللأسف، لا تزال الطرق الحالية لـ NR-IQA بعيدة عن تلبية الحاجة إلى توقع درجات جودة دقيقة للصور التي تعاني من تشوهات ناتجة عن الشبكات العصبية التوليدية (GAN). ولحل هذه المشكلة، نقترح شبكة انتباه متعددة الأبعاد لتقييم جودة الصور بدون مرجع (MANIQA)، بهدف تحسين الأداء في حالة التشوهات الناتجة عن GAN. نبدأ باستخراج الميزات باستخدام ViT (Transformer البصري)، ثم نُعزز التفاعلات العالمية والمكانية من خلال اقتراح كتلة الانتباه المعكوسة (TAB) وكتلة مُحول سوين المُقياس (SSTB). تُطبّق هاتان الوحدتان آليات الانتباه على المحور القنوي والمحور المكاني على التوالي. وبهذه الطريقة المتعددة الأبعاد، تعمل الوحدات معًا لتعزيز التفاعل بين مناطق مختلفة في الصورة على المستوى العالمي والمحلي. وأخيرًا، نُطبّق هيكلًا ثنائي الفرع لتنبؤ جودة مُوزّعة حسب المساحة (patch-weighted)، حيث يتم التنبؤ بالنتيجة النهائية بناءً على وزن كل مساحة (patch) من حيث درجة جودتها. أظهرت النتائج التجريبية أن MANIQA تتفوّق على أحدث الطرق في أربع مجموعات بيانات قياسية (LIVE، TID2013، CSIQ، وKADID-10K) بفارق كبير. علاوةً على ذلك، حصلت طريقةنا على المركز الأول في المرحلة النهائية لتحدي تقييم جودة الصور الإدراكية في NTIRE 2022، في المسار الثاني: بدون مرجع. يمكن الوصول إلى الشيفرة النصية والنموذج عبر الرابط التالي: https://github.com/IIGROUP/MANIQA.

مانيا: شبكة انتباه متعددة الأبعاد لتقييم جودة الصورة بدون مرجع | الأوراق البحثية | HyperAI