ERQA : Évaluation de la Qualité de Restauration au Niveau de la Bordure pour la Résolution Vidéo Améliorée

Malgré l’essor croissant de la super-résolution vidéo (VSR), il n’existe toujours pas de méthode fiable pour évaluer la qualité des détails restaurés dans les images agrandies. Certaines méthodes de SR peuvent produire des chiffres erronés ou même des visages entièrement différents. La fiabilité des résultats d’une méthode dépend directement de sa capacité à restaurer des détails véridiques. En super-résolution d’image, on peut exploiter des distributions naturelles pour générer une image haute résolution qui ressemble seulement partiellement à l’original. La VSR, quant à elle, permet d’exploiter des informations supplémentaires présentes dans les cadres voisins afin de restaurer des détails fidèles à la scène d’origine. Le métrique ERQA, que nous proposons dans cet article, vise à estimer la capacité d’un modèle à restaurer des détails réels grâce à la VSR. En supposant que les contours jouent un rôle crucial dans la reconnaissance des détails et des caractères, nous avons choisi la fidélité des contours comme fondement de cette métrique. La validation expérimentale de notre travail repose sur le benchmark MSU Video Super-Resolution, qui inclut les cas les plus difficiles pour la restauration des détails et permet de vérifier la fidélité des détails par rapport au cadre d’origine. Le code associé à la métrique proposée est disponible publiquement à l’adresse suivante : https://github.com/msu-video-group/ERQA.