Prédiction vidéo
La Prédiction Vidéo est une technologie avancée dans le domaine de la vision par ordinateur qui vise à prédire le contenu des futures images en analysant les modèles spatiotemporels dans les séquences vidéo. L'objectif principal de cette technologie est d'améliorer le niveau d'intelligence du traitement vidéo, permettant une prévision précise des scènes dynamiques. Sa valeur d'application est considérable, incluant notamment la surveillance intelligente, la conduite autonome et l'analyse du mouvement, ce qui peut considérablement améliorer la réactivité en temps réel et l'efficacité de prise de décision des systèmes.
KTH
SAVP-VAE
Moving MNIST
PredFormer
Kinetics-600 12 frames, 64x64
Human3.6M
IAM4VP
BAIR Robot Pushing
Cityscapes 128x128
SRVP
SynpickVP
SVG-Det
CMU Mocap-2
Latent SDE
Cityscapes
DMVFN
KITTI
Vimeo90K
CMU Mocap-1
ODE2VAE-KL
DAVIS 2017
DMVFN
Colored dSprites
MGP-VAE (with geodesic loss)
KTH 64x64 cond10 pred30
SRVP
MPI Sintel
MCnet [villegas2017mcnet]
Something-Something V2
MAGVIT
Sprites
MGP-VAE (with geodesic loss)
YouTube-8M
SDCNet