HyperAIHyperAI
منذ 7 أيام

خسارة نورم-فـي-نورم ذات تقارب أسرع وأداء أفضل لتقييم جودة الصورة

Dingquan Li, Tingting Jiang, Ming Jiang
خسارة نورم-فـي-نورم ذات تقارب أسرع وأداء أفضل لتقييم جودة الصورة
الملخص

في الوقت الراهن، تعتمد معظم نماذج تقييم جودة الصور (IQA) على دالة الخسارة MAE أو MSE، والتي تتميز بتباطؤ في التقارب بشكل تجريبي. ومن المعروف جيدًا أن التطبيع يُسهم في تسريع عملية التقارب. ولهذا السبب، نستكشف استخدام التطبيع في تصميم دوال الخسارة لـ IQA. بشكل محدد، نقوم أولاً بتطبيع القيم المتنبأ بها لجودة الصور والقيم ذاتية الجودة المقابلة لها. ثم نُعرّف دالة الخسارة بناءً على معيار الفرق بين هذه القيم المطوبة. يؤدي هذا إلى ما يُسمى بـ "الخسارة داخل المعيار" (Norm-in-Norm)، والتي تُشجع نموذج IQA على إجراء تنبؤات خطية بالنسبة إلى القيم ذاتية للجودة. وبعد التدريب، يتم تطبيق الانحدار التربيعي الأدنى لتحديد التحويل الخطي من القيم المتنبأ بها إلى القيم ذاتية للجودة. وقد أظهرت النتائج أن الدالة الجديدة مرتبطة بشكل وثيق بمعيارين شائعيين لتقييم أداء IQA (PLCC و RMSE). وبتحليل نظري، ثبت أن التطبيع المدمج يجعل المشتقات (الGradient) لدالة الخسارة أكثر استقرارًا وتوقعًا، مما يعزز التقارب الأسرع لنموذج IQA. علاوةً على ذلك، لاختبار فعالية الدالة المقترحة تجريبيًا، تم تطبيقها على مشكلة صعبة: تقييم جودة الصور في البيئة الحقيقية (in-the-wild). أظهرت التجارب على مجموعتي بيانات مرتبطتين (KonIQ-10k و CLIVE) أن الدالة الجديدة تُمكّن نموذج IQA من التقارب بأكثر من 10 مرات أسرع مقارنةً بدالة MAE أو MSE، كما تحقق النموذج النهائي أداءً أفضل. وتمكّن النموذج المقترح من تحقيق أفضل أداء متوقع (state-of-the-art) في هذه المشكلة الصعبة. ولضمان التكرار العلمي، تم إتاحة الكود الخاص بنا بشكل عام على الرابط التالي: https://github.com/lidq92/LinearityIQA.

خسارة نورم-فـي-نورم ذات تقارب أسرع وأداء أفضل لتقييم جودة الصورة | أحدث الأوراق البحثية | HyperAI