HyperAIHyperAI
منذ 17 أيام

كونكس: تقييم جودة الصور عبر الدقة المختلفة

Oliver Wiedemann, Vlad Hosu, Shaolin Su, Dietmar Saupe
كونكس: تقييم جودة الصور عبر الدقة المختلفة
الملخص

الاستقرار التماثلي (Scale-invariance) يُعدّ مشكلة مفتوحة في العديد من مجالات الرؤية الحاسوبية. على سبيل المثال، يجب أن تبقى التصنيفات الموضوعية ثابتة عبر المقياسات المختلفة، لكن تنبؤات النماذج تتشتت في العديد من الحالات. وتصعب هذه المشكلة أكثر في المهام التي تتغير فيها التصنيفات الحقيقية (ground-truth) حسب مقياس العرض. في تقييم جودة الصور (IQA)، فإن التناقص في الدقة (downsampling) يُقلّل من تأثير العيوب، مثل الضبابية أو تشوهات الضغط (compression artifacts)، ما قد يؤثر إيجابًا على الانطباع الناتج عن الدراسات الموضوعية. لذا، يجب أن تأخذ أساليب تقييم جودة الصور عبر المقياسات المختلفة (cross-resolution IQA) بعين الاعتبار الأخطاء المُعتمدّة على الدقة الناتجة عن قصور النماذج، فضلًا عن التحولات في التصنيفات الحسية في البيانات الحقيقية. نقدم أول دراسة من نوعها تُفكّك هاتين المشكلتين وتنظر في كل منهما على حدة، من خلال قاعدة بيانات جديدة ومصممة بعناية تُسمّى "KonX"، وهي قاعدة بيانات تقييم جودة صور عبر المقياسات المختلفة. تساهم هذه الورقة في النتائج التالية: 1. من خلال KonX، نقدم أدلة تجريبية على وجود تحولات في التصنيفات الناتجة عن تغير مقياس عرض الصور. 2. نُظهر أن النماذج الموضوعية لتقييم جودة الصور تعاني من تحيّز معياري (scale bias)، مما يقلّل من كفاءتها التنبؤية. 3. نقترح معمارية جديدة لشبكة عصبية عميقة متعددة المقياسات ومتعددة الأعمدة (multi-scale and multi-column DNN) تُحسّن الأداء مقارنةً بالنماذج المُتقدمة السابقة في مجال تقييم جودة الصور، بما في ذلك نماذج المحولات الحديثة (transformers). وهكذا، نطرح مشكلة بحثية جديدة في مجال تقييم جودة الصور، ونقدّم حلولًا لها في الوقت نفسه.

كونكس: تقييم جودة الصور عبر الدقة المختلفة | أحدث الأوراق البحثية | HyperAI