Rendre Vivants les Moments Flous

Nous présentons une solution visant à extraire une vidéo d'une seule image floue due au mouvement, afin de reconstruire séquentiellement les vues claires d'une scène telle qu'elle a été perçue par la caméra pendant le temps d'exposition. Nous apprenons d'abord la représentation du mouvement à partir de vidéos nettes de manière non supervisée, en formant un réseau autoencodeur vidéo récurrent convolutif qui effectue une tâche substitutive de reconstruction vidéo. Une fois formé, ce réseau est utilisé pour guider l'entraînement d'un encodeur de mouvement pour les images floues. Ce réseau extrait des informations de mouvement intégrées dans l'image floue pour générer une vidéo nette en conjonction avec le décodeur vidéo récurrent formé. Comme étape intermédiaire, nous avons également conçu une architecture efficace qui permet le défloutage en temps réel d'une seule image et surpassent les méthodes concurrentes sur tous les aspects : précision, rapidité et compacité. Les expériences menées sur des scènes réelles et des jeux de données standards démontrent la supériorité de notre cadre par rapport à l'état de l'art et sa capacité à générer une séquence plausible de trames nettes temporellement cohérentes.