Perte Norme-en-Norme avec convergence plus rapide et meilleure performance pour l'évaluation de la qualité d'image

Actuellement, la plupart des modèles d’évaluation de la qualité d’image (IQA) sont entraînés à l’aide de pertes MAE ou MSE, qui présentent une convergence empiriquement lente. Il est bien établi que la normalisation peut favoriser une convergence plus rapide. Par conséquent, nous explorons l’intégration de la normalisation dans la conception des fonctions de perte pour l’IQA. Plus précisément, nous normalisons d’abord les scores de qualité prédits et les scores de qualité subjectifs correspondants. Ensuite, la perte est définie à partir de la norme des différences entre ces valeurs normalisées. La perte ainsi obtenue, appelée « Norm-in-Norm », encourage le modèle d’IQA à produire des prédictions linéaires par rapport aux scores subjectifs de qualité. Après l’entraînement, une régression par moindres carrés est appliquée pour déterminer la transformation linéaire reliant les scores prédits aux scores subjectifs. Il est démontré que cette nouvelle perte est étroitement liée à deux critères de performance courants en IQA (PLCC et RMSE). Une analyse théorique montre que la normalisation intégrée stabilise et rend plus prévisible les gradients de la fonction de perte, ce qui favorise une convergence plus rapide du modèle d’IQA. En outre, pour vérifier expérimentalement l’efficacité de la perte proposée, nous l’appliquons à un problème difficile : l’évaluation de la qualité d’images prises dans des environnements réels (in-the-wild). Des expériences menées sur deux jeux de données pertinents (KonIQ-10k et CLIVE) montrent que, par rapport aux pertes MAE ou MSE, la nouvelle perte permet au modèle d’IQA de converger environ dix fois plus vite, tout en atteignant une performance finale supérieure. Le modèle proposé atteint également des résultats de prédiction de niveau état de l’art sur ce problème difficile. Pour garantir la reproductibilité de la recherche scientifique, notre code est disponible publiquement à l’adresse suivante : https://github.com/lidq92/LinearityIQA.