Interpolation de trames vidéo avec corrélation bilatérale interrogée de manière dense

L’interpolation de trames vidéo (VFI) vise à synthétiser des trames intermédiaires inexistantes entre des trames existantes. Les algorithmes de VFI basés sur le flux estiment les champs de mouvement intermédiaires afin de déformer les trames existantes. La complexité des mouvements du monde réel ainsi que l’absence de trame de référence rendent l’estimation du mouvement particulièrement difficile. De nombreuses approches de pointe modélisent explicitement les corrélations entre deux trames voisines afin d’améliorer l’exactitude de l’estimation du mouvement. Dans les approches courantes, le champ de réception utilisé pour la modélisation des corrélations à haute résolution dépend des champs de mouvement estimés préalablement. Ce dépendance du champ de réception limite l’efficacité des méthodes classiques d’estimation du mouvement, notamment pour les objets petits et rapidement mobiles. Afin de mieux modéliser les corrélations et de produire des champs de mouvement plus précis, nous proposons une nouvelle méthode, la Corrélation Bilatérale à Requêtes Denses (DQBC), qui élimine le problème de dépendance du champ de réception, rendant ainsi l’approche particulièrement adaptée aux objets petits et rapides. Les champs de mouvement générés grâce à la DQBC sont ensuite affinés et interpolés à l’aide de caractéristiques contextuelles. Une fois les champs de mouvement stabilisés, un réseau CNN appelé SynthNet synthétise la trame intermédiaire finale. Les expériences montrent que notre méthode atteint une meilleure précision tout en réduisant le temps d’inférence par rapport aux approches de pointe actuelles. Le code source est disponible à l’adresse suivante : https://github.com/kinoud/DQBC.