UGC-VQA : Évaluation du Blind Video Quality Assessment pour le contenu généré par les utilisateurs

Les dernières années ont vu une explosion du contenu vidéo généré par les utilisateurs (UGC), partagé et diffusé sur Internet, grâce à l’évolution de dispositifs de capture grand public abordables et fiables, ainsi qu’à la popularité croissante des plateformes de médias sociaux. En conséquence, il existe un besoin crucial de modèles précis d’évaluation de la qualité vidéo (VQA) pour les vidéos UGC ou grand public, afin de surveiller, contrôler et optimiser cette vaste quantité de contenu. La prédiction aveugle de la qualité des vidéos capturées dans des environnements réels (in-the-wild) reste particulièrement difficile, car les dégradations de qualité affectant les contenus UGC sont imprévisibles, complexes et souvent entremêlées. Dans cette étude, nous contribuons à l’avancement du problème UGC-VQA en menant une évaluation approfondie des caractéristiques et modèles de VQA sans référence (BVQA) les plus performants, dans une architecture d’évaluation fixe, offrant ainsi de nouvelles insights empiriques tant sur les études subjectives de qualité vidéo que sur la conception des modèles VQA. En appliquant une stratégie de sélection de caractéristiques sur les fonctionnalités des meilleurs modèles VQA, nous parvenons à extraire 60 des 763 caractéristiques statistiques utilisées par ces modèles, afin de concevoir un nouveau modèle BVQA fondé sur la fusion, que nous désignons sous le nom de VIDeo quality EVALuator (VIDEVAL). Ce modèle équilibre efficacement le compromis entre performance et efficacité. Nos résultats expérimentaux montrent que VIDEVAL atteint des performances de pointe tout en nécessitant un coût computationnel nettement inférieur à celui des modèles les plus avancés. Notre protocole d’étude établit également une référence fiable pour le problème UGC-VQA, que nous pensons favoriserait davantage la recherche future sur la modélisation VQA basée sur l’apprentissage profond, ainsi que le traitement, la transcoding et la diffusion efficaces des vidéos UGC optimisés pour la perception humaine. Pour promouvoir la recherche reproductible et l’évaluation publique, une implémentation de VIDEVAL est désormais disponible en ligne : \url{https://github.com/tu184044109/VIDEVAL_release}.