KonIQ-10k : Une base de données écologiquement valide pour l’apprentissage profond de l’évaluation aveugle de la qualité d’image

Les méthodes d’apprentissage profond pour l’évaluation de la qualité d’image (IQA) sont limitées par la taille restreinte des bases de données existantes. La création de bases de données étendues nécessite des ressources considérables, tant pour la génération de contenus exploitables que pour leur annotation précise. Nous présentons une approche systématique et évolutif pour construire KonIQ-10k, la plus grande base de données d’IQA jamais constituée, comprenant 10 073 images annotées selon leur qualité. Il s’agit de la première base de données « in-the-wild » conçue pour garantir une validité écologique, en tenant compte de l’authenticité des distorsions, de la diversité du contenu et des indicateurs liés à la qualité. Grâce à une approche par crowdsourcing, nous avons obtenu 1,2 million d’évaluations fiables de qualité provenant de 1 459 contributeurs, ouvrant la voie à des modèles d’IQA plus généraux. Nous proposons un nouveau modèle d’apprentissage profond, KonCept512, qui démontre une excellente généralisation au-delà de l’ensemble de test (0,921 SROCC), surpassant ainsi les performances actuelles sur la base de données de référence LIVE-in-the-Wild (0,825 SROCC). La performance centrale de ce modèle repose sur l’architecture InceptionResNet, entraînée à une résolution plus élevée que celle des modèles précédents (512×384). Une analyse de corrélation montre que KonCept512 se comporte comme si chaque image de test disposait de 9 notes subjectives.