منذ 11 أيام

Re-IQA: التعلم غير المراقب لتقييم جودة الصور في البيئة الطبيعية

Avinab Saha, Sandeep Mishra, Alan C. Bovik

الملخص

تقييم جودة الصور البصرية التلقائي يُعد مشكلة صعبة تؤثر يوميًا على مليارات المستخدمين على الإنترنت ووسائل التواصل الاجتماعي. ولتعزيز البحث في هذا المجال، نقترح منهجًا مبنيًا على "مجموعة من الخبراء" (Mixture of Experts) لتدريب شريحتين من المُشَكِّلات (encoders) بشكل منفصل، بهدف تعلُّم سمات محتوى عالية المستوى وسمات جودة صورة منخفضة المستوى في بيئة غير مُعلَّمة. والابتكار الفريد في منهجنا يتمثل في قدرته على إنتاج تمثيلات منخفضة المستوى لجودة الصورة تكون مكملة لسمات عالية المستوى تمثل محتوى الصورة. ونُشير إلى الإطار المستخدم لتدريب الشريحتين المذكورتين باسم Re-IQA. ولتقييم جودة الصور في البيئات الواقعية (Image Quality Assessment in the Wild)، نُطبّق التمثيلات المنخفضة والمرتفعة المستوى المُستخلصة من إطار Re-IQA لتدريب نموذج انحدار خطي، والذي يستخدم لتحويل تمثيلات الصور إلى درجات جودة حقيقية، انظر الشكل 1. تُظهر نتائج طريقةنا أداءً متقدمًا على مستوى العالم (state-of-the-art) في عدة قواعد بيانات ضخمة لتقييم جودة الصور، تضم تشوهات حقيقية واصطناعية، مما يُظهر كيف يمكن تدريب الشبكات العصبية العميقة في بيئة غير مُعلَّمة لإنتاج تمثيلات ذات صلة بالاستقبال البصري. ونتوصل من تجاربنا إلى أن السمات المنخفضة والمرتفعة المستوى المستخلصة فعلاً مكملة لبعضها البعض، وتساهم بشكل إيجابي في أداء نموذج الانحدار الخطي. وسيتم إتاحة الكود البرمجي الكامل المرتبط بهذه الدراسة للجمهور عبر منصة GitHub.