ビデオ生成
ビデオ生成は、コンピュータビジョンの分野において重要なタスクであり、アルゴリズムを用いて自動的に高品質なビデオコンテンツを生成することを目指しています。この目標を達成するためには、ジェネレーティブ・アドバーザリアル・ネットワーク(GAN)やバリエーションオートエンコーダー(VAE)などの深層学習モデルが使用されます。これらのモデルは、静止画、テキスト記述、または他のビデオクリップから一貫性があり、現実的な動的ビデオを作成します。ビデオ生成技術は、映画製作、仮想現実、ゲーム開発、広告クリエイティブなどの分野で広範な応用価値を持ち、コンテンツ制作の効率と革新性を大幅に向上させています。
UCF-101
MAGVIT (-L-CG, 128x128, class-conditional)
BAIR Robot Pushing
MAGVIT
Sky Time-lapse
UCF-101 16 frames, Unconditional, Single GPU
TGAN-F
UCF-101 16 frames, 64x64, Unconditional
Video Diffusion Model
LAION-400M
Taichi
DIGAN (256x256)
UCF-101 16 frames, 128x128, Unconditional
TGANv2 (2020)
Kinetics-600 12 frames, 64x64
MAGVIT
How2Sign
Kinetics-600 12 frames, 128x128
DVD-GAN
Kinetics-600 48 frames, 64x64
DVD-GAN
MSR-VTT
VideoAssembler (Zero-Shot, 256x256, class-conditional)
TrailerFaces
PG-SWGAN-3D
YouTube Driving
StyleSV
UCF101