Video Generation
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。この技術の目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を実現することです。コンピュータビジョンは医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性和正確性を大幅に向上させ、知能社会の発展に貢献しています。
BAIR Robot Pushing
MAGVIT
How2Sign
Kinetics-600 12 frames, 128x128
DVD-GAN
Kinetics-600 12 frames, 64x64
MAGVIT
Kinetics-600 48 frames, 64x64
DVD-GAN
LAION-400M
MSR-VTT
VideoAssembler (Zero-Shot, 256x256, class-conditional)
Sky Time-lapse
Taichi
DIGAN (256x256)
TrailerFaces
PG-SWGAN-3D
UCF-101
FIFO-Diffusion
UCF-101 16 frames, 128x128, Unconditional
TGANv2 (2020)
UCF-101 16 frames, 64x64, Unconditional
Video Diffusion Model
UCF-101 16 frames, Unconditional, Single GPU
TGAN-F
UCF101
YouTube Driving
StyleSV