Video Generation
La vision par ordinateur est une technologie qui permet aux machines d'interpréter et de comprendre les images et les vidéos. Son objectif est d'atteindre la reconnaissance et l'analyse automatiques de scènes complexes en simulant le système visuel humain. Cette technologie est largement utilisée dans des domaines tels que le diagnostic d'images médicales, la conduite autonome et la surveillance de sécurité, améliorant considérablement l'efficacité et la précision, et favorisant le développement d'une société intelligente.
BAIR Robot Pushing
MAGVIT
How2Sign
Kinetics-600 12 frames, 128x128
DVD-GAN
Kinetics-600 12 frames, 64x64
MAGVIT
Kinetics-600 48 frames, 64x64
DVD-GAN
LAION-400M
MSR-VTT
VideoAssembler (Zero-Shot, 256x256, class-conditional)
Sky Time-lapse
Taichi
DIGAN (256x256)
TrailerFaces
PG-SWGAN-3D
UCF-101
FIFO-Diffusion
UCF-101 16 frames, 128x128, Unconditional
TGANv2 (2020)
UCF-101 16 frames, 64x64, Unconditional
Video Diffusion Model
UCF-101 16 frames, Unconditional, Single GPU
TGAN-F
UCF101
YouTube Driving
StyleSV