Débrouillage vidéo récurrent avec estimation de mouvement invariante au flou et volumes de pixels

Pour réussir le déflouage vidéo, il est essentiel d’utiliser l’information provenant des trames voisines. La plupart des méthodes de déflouage vidéo les plus avancées adoptent une compensation du mouvement entre trames vidéo afin d’agréger l’information provenant de plusieurs trames, ce qui aide à déflouer une trame cible. Toutefois, les méthodes de compensation du mouvement utilisées par les approches antérieures ne sont pas invariantes au flou, ce qui limite leur précision lorsqu’elles sont appliquées à des trames floues présentant des degrés de flou différents. Pour atténuer ce problème, nous proposons deux nouvelles approches pour déflouer des vidéos en exploitant efficacement l’information provenant de plusieurs trames. Premièrement, nous introduisons un apprentissage de l’estimation du mouvement invariant au flou, visant à améliorer la précision de l’estimation du mouvement entre trames floues. Deuxièmement, pour la compensation du mouvement, au lieu d’aligner les trames par déformation basée sur les mouvements estimés, nous utilisons un volume de pixels contenant des pixels nets candidats afin de corriger les erreurs d’estimation du mouvement. En combinant ces deux processus, nous proposons un réseau récurrent efficace pour le déflouage vidéo, qui exploite pleinement les trames précédentes déjà déflouées. Les expériences montrent que notre méthode atteint des performances au niveau de l’état de l’art, tant sur le plan quantitatif que qualitatif, par rapport aux méthodes récentes basées sur l’apprentissage profond.