KonIQ-10k: قاعدة بيانات صالحة بيئيًا لتعلم الآلة العميق لتقييم جودة الصور العمياء

تُعاني أساليب التعلم العميق لتقييم جودة الصور (IQA) من قيود ناتجة عن حجم البيانات الموجودة الصغيرة. فتتطلب مجموعات البيانات الواسعة موارد كبيرة، سواء في إنتاج المحتوى القابل للنشر أو في تسمية الصور بدقة. نقدم نهجًا منهجيًا وقابلًا للتوسع لإنشاء قاعدة بيانات KonIQ-10k، أكبر قاعدة بيانات لتقييم جودة الصور حتى الآن، والتي تتضمن 10,073 صورة تم تقييم جودتها. وهي أول قاعدة بيانات مُجمَّعة من البيئة الطبيعية (in-the-wild) تهدف إلى صدقية بيئية، من حيث مصداقية التشوهات، وتعدد محتوى الصور، ومؤشرات الجودة المرتبطة بها. من خلال استخدام منصة التوظيف الجماعي (crowdsourcing)، تم جمع 1.2 مليون تقييم موثوق لجودة الصور من 1,459 عاملًا من الجمهور، مما فتح المجال أمام نماذج تقييم جودة الصور أكثر شمولاً. ونُقدِّم نموذجًا جديدًا بالتعلم العميق (KonCept512) يُظهر أداءً ممتازًا في التعميم خارج مجموعة الاختبار (0.921 SROCC)، متفوقًا على أفضل النماذج الحالية المُطبقة على قاعدة بيانات LIVE-in-the-Wild (0.825 SROCC). ويستمد النموذج أداءه الأساسي من بنية InceptionResNet، حيث تم تدريبه بدرجة دقة أعلى من النماذج السابقة (512×384). وتُظهر تحليلات الارتباط أن أداء KonCept512 يعادل وجود 9 تقييمات ذاتية لكل صورة اختبارية.