HyperAIHyperAI
il y a 11 jours

ProPainter : Amélioration de la propagation et du Transformer pour le remplissage vidéo

Shangchen Zhou, Chongyi Li, Kelvin C.K. Chan, Chen Change Loy
ProPainter : Amélioration de la propagation et du Transformer pour le remplissage vidéo
Résumé

La propagation basée sur le flux et le Transformer spatio-temporel constituent deux mécanismes principaux dans le remplissage vidéo (VI). Malgré leur efficacité, ces composants souffrent encore de certaines limitations qui nuisent à leurs performances. Les approches précédentes fondées sur la propagation opèrent séparément soit dans le domaine d’image, soit dans celui des caractéristiques. La propagation globale d’image, isolée de l’apprentissage, peut entraîner un désalignement spatial en raison d’un flux optique inexact. Par ailleurs, les contraintes mémoire ou computationnelles limitent la portée temporelle de la propagation des caractéristiques et du Transformer vidéo, empêchant ainsi l’exploration d’informations de correspondance provenant de trames éloignées. Pour remédier à ces problèmes, nous proposons un cadre amélioré, nommé ProPainter, intégrant une propagation renforcée et un Transformer efficace. Plus précisément, nous introduisons une propagation en double domaine, combinant les avantages de la déformation d’image et celle des caractéristiques, afin d’exploiter de manière fiable les correspondances globales. Nous proposons également un Transformer vidéo creux guidé par le masque, qui atteint une haute efficacité en éliminant les tokens inutiles et redondants. Grâce à ces composants, ProPainter dépasse largement les méthodes antérieures, avec une amélioration de 1,46 dB en PSNR, tout en maintenant une efficacité remarquable.

ProPainter : Amélioration de la propagation et du Transformer pour le remplissage vidéo | Articles de recherche récents | HyperAI