
要約
本論文では、低レベルビデオタスクであるビデオフレーム補間(VFI)のための大規模ビデオ補間ベンチマーク(LArge-scale Video Interpolation Benchmark: LAVIB)を紹介します。LAVIBは、人間による検証の必要性が最小限に抑えられた自動パイプラインを通じてウェブから収集された高解像度ビデオの大量のコレクションで構成されています。各ビデオの運動量、輝度条件、フレームのシャープネス、コントラストについて指標が計算されています。これらの指標に基づいた定量的な課題の作成とビデオのコレクションは、現在の低レベルビデオタスクデータセットによって十分に探索されていません。合計して、LAVIBには1万7000本の超HDビデオから28万3000個のクリップが含まれており、総再生時間は77.6時間です。ベンチマークの訓練セット、検証セット、テストセットは同様のビデオ指標分布を維持しています。さらに、訓練セットとテストセットに異なる属性を持つビデオを含む外れ値(Out-of-Distribution: OOD)課題用にも分割が作成されています。