HyperAIHyperAI
il y a 11 jours

Prédiction aveugle de la qualité des vidéos naturelles

{Christophe Charrier, Alan C. Bovik, Michele A. Saad}
Prédiction aveugle de la qualité des vidéos naturelles
Résumé

Nous proposons un modèle d’évaluation de la qualité vidéo aveugle (sans référence, NR), non spécifique aux distorsions. Cette approche repose sur un modèle spatio-temporel des scènes vidéo dans le domaine de la transformation en cosinus discrète (DCT), ainsi que sur un modèle caractérisant le type de mouvement présent dans les scènes, afin de prédire la qualité vidéo. Ces modèles sont utilisés pour définir des statistiques vidéo et des caractéristiques perceptuelles qui constituent la base d’un algorithme d’évaluation de la qualité vidéo (VQA) ne nécessitant pas la présence d’une vidéo originale de référence pour effectuer une comparaison et prédire un score de qualité perceptuelle. Les contributions de cet article sont triples : 1) nous proposons un modèle de statistiques naturelles de scènes spatio-temporelles (NSS) adapté aux vidéos ; 2) nous introduisons un modèle de mouvement permettant de quantifier la cohérence du mouvement dans les scènes vidéo ; 3) nous démontrons que les modèles proposés de NSS et de cohérence du mouvement sont adaptés à l’évaluation de la qualité vidéo, et nous les exploitons pour concevoir un algorithme aveugle de VQA présentant une forte corrélation avec les jugements humains de qualité. L’algorithme proposé, nommé video BLIINDS, a été testé sur la base de données LIVE VQA et sur la base EPFL-PoliMi, et s’est révélé performant à un niveau proche des meilleurs algorithmes de VQA à référence réduite ou complète.

Prédiction aveugle de la qualité des vidéos naturelles | Articles de recherche récents | HyperAI