2ヶ月前

複雑なデータセットにおける敵対的ビデオ生成

Clark, Aidan ; Donahue, Jeff ; Simonyan, Karen
複雑なデータセットにおける敵対的ビデオ生成
要約

自然画像の生成モデルは、スケールを活用することで高忠実度のサンプルを生成する方向に進歩してきました。本研究では、この成功をビデオモデリング分野にも持ち込むことを目指し、Kinetics-600データセット上で訓練された大規模な生成対抗ネットワーク(Generative Adversarial Networks: GAN)が、従来の研究よりも大幅に複雑で高忠実度のビデオサンプルを生成できることを示します。提案するモデルであるDual Video Discriminator GAN (DVD-GAN)は、判別器の計算効率の高い分解を利用することで、より長く高解像度のビデオへとスケーリングすることが可能です。我々はビデオ合成およびビデオ予測という関連タスクにおいて評価を行い、Kinetics-600における予測のFréchet Inception Distance(FID)で新たな最先端性能を達成するとともに、UCF-101データセットでの合成のInception Scoreでも最先端性能を達成しました。また、Kinetics-600での合成における強力なベースラインを確立しています。

複雑なデータセットにおける敵対的ビデオ生成 | 最新論文 | HyperAI超神経