Synthèse Vidéo Future avec Prédiction du Mouvement des Objets

Nous présentons une approche permettant de prédire les futures images d'une séquence vidéo à partir d'une série d'images vidéo continues du passé. Au lieu de synthétiser directement des images, notre méthode est conçue pour comprendre la dynamique complexe de la scène en dissociant le fond et les objets en mouvement. L'apparence future des composants de la scène est prédite par déformation non rigide du fond et transformation affine des objets en mouvement. Les apparences anticipées sont combinées pour créer une séquence vidéo future raisonnable. Grâce à cette procédure, notre méthode présente beaucoup moins d'artefacts de déchirure ou de distorsion comparée à d'autres approches. Les résultats expérimentaux sur les jeux de données Cityscapes et KITTI montrent que notre modèle surpassent l'état de l'art en termes de qualité visuelle et de précision.