2ヶ月前

ビデオ拡散モデル

Jonathan Ho; Tim Salimans; Alexey Gritsenko; William Chan; Mohammad Norouzi; David J. Fleet
ビデオ拡散モデル
要約

時間的に一貫性のある高忠実度ビデオの生成は、生成モデル研究における重要なマイルストーンです。本研究では、このマイルストーン達成に向けて提案するビデオ生成用の拡散モデルが非常に有望な初期結果を示しています。当該モデルは標準的な画像拡散アーキテクチャの自然な拡張であり、画像データとビデオデータから共同で学習することを可能にします。これによりミニバッチ勾配の分散が減少し、最適化が加速されることが確認されました。長時間かつ高解像度のビデオを生成するために、空間および時間的なビデオ拡張を行う新しい条件付きサンプリング技術を導入しました。これは既存の手法よりも優れた性能を発揮します。また、大規模なテキスト条件付きビデオ生成タスクにおける最初の結果と、既存のビデオ予測および無条件ビデオ生成ベンチマークにおける最先端の結果を提示します。補足資料は以下のURLで入手可能です: https://video-diffusion.github.io/

ビデオ拡散モデル | 最新論文 | HyperAI超神経