HyperAIHyperAI

Command Palette

Search for a command to run...

UGC-VQA : Évaluation du Blind Video Quality Assessment pour le contenu généré par les utilisateurs

Zhengzhong Tu Yilin Wang Neil Birkbeck Balu Adsumilli Alan C. Bovik

Résumé

Les dernières années ont vu une explosion du contenu vidéo généré par les utilisateurs (UGC), partagé et diffusé sur Internet, grâce à l’évolution de dispositifs de capture grand public abordables et fiables, ainsi qu’à la popularité croissante des plateformes de médias sociaux. En conséquence, il existe un besoin crucial de modèles précis d’évaluation de la qualité vidéo (VQA) pour les vidéos UGC ou grand public, afin de surveiller, contrôler et optimiser cette vaste quantité de contenu. La prédiction aveugle de la qualité des vidéos capturées dans des environnements réels (in-the-wild) reste particulièrement difficile, car les dégradations de qualité affectant les contenus UGC sont imprévisibles, complexes et souvent entremêlées. Dans cette étude, nous contribuons à l’avancement du problème UGC-VQA en menant une évaluation approfondie des caractéristiques et modèles de VQA sans référence (BVQA) les plus performants, dans une architecture d’évaluation fixe, offrant ainsi de nouvelles insights empiriques tant sur les études subjectives de qualité vidéo que sur la conception des modèles VQA. En appliquant une stratégie de sélection de caractéristiques sur les fonctionnalités des meilleurs modèles VQA, nous parvenons à extraire 60 des 763 caractéristiques statistiques utilisées par ces modèles, afin de concevoir un nouveau modèle BVQA fondé sur la fusion, que nous désignons sous le nom de VIDeo quality EVALuator (VIDEVAL). Ce modèle équilibre efficacement le compromis entre performance et efficacité. Nos résultats expérimentaux montrent que VIDEVAL atteint des performances de pointe tout en nécessitant un coût computationnel nettement inférieur à celui des modèles les plus avancés. Notre protocole d’étude établit également une référence fiable pour le problème UGC-VQA, que nous pensons favoriserait davantage la recherche future sur la modélisation VQA basée sur l’apprentissage profond, ainsi que le traitement, la transcoding et la diffusion efficaces des vidéos UGC optimisés pour la perception humaine. Pour promouvoir la recherche reproductible et l’évaluation publique, une implémentation de VIDEVAL est désormais disponible en ligne : \url{https://github.com/tu184044109/VIDEVAL_release}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp