Approche à deux niveaux pour l'évaluation sans référence de la qualité des vidéos consommées
Les smartphones et autres appareils grand public capables de capturer du contenu vidéo et de le partager sur les réseaux sociaux presque en temps réel sont aujourd’hui largement disponibles à un coût raisonnable. En conséquence, la nécessité d’évaluer la qualité vidéo sans référence (NR-VQA, no-reference video quality assessment) du contenu vidéo produit par les utilisateurs grand public s’accroît de manière significative. Ce type de contenu est généralement caractérisé par des dégradations liées à la capture, qui diffèrent qualitativement des dégradations observées dans les vidéos produites professionnellement. À ce jour, la plupart des modèles de NR-VQA proposés dans l’état de l’art ont été conçus pour évaluer les distorsions liées au codage et à la transmission, plutôt que les dégradations liées à la capture. De plus, les méthodes de NR-VQA les plus précises connues dans l’état de l’art sont souvent très complexes du point de vue computationnel, ce qui les rend peu pratiques pour de nombreuses applications réelles. Dans cet article, nous proposons une nouvelle approche d’évaluation de la qualité vidéo fondée sur l’apprentissage automatique, reposant sur une architecture à deux niveaux de calcul des caractéristiques : tout d’abord, des caractéristiques à faible complexité sont calculées sur l’ensemble de la séquence vidéo, puis des caractéristiques à haute complexité sont extraites à partir d’un sous-ensemble de trames représentatives, sélectionnées à l’aide des caractéristiques à faible complexité. Nous avons comparé la méthode proposée à plusieurs méthodes de référence pertinentes en utilisant trois bases de données publiques récentes d’images vidéo annotées, et nos résultats montrent que la méthode proposée permet de prédire la qualité vidéo subjective avec une précision supérieure à celle des méthodes de référence. La meilleure méthode existante atteint une précision similaire, mais à un coût computationnel significativement plus élevé.