18日前

高品質なフレーム補間のためのクロスビデオニューラル表現の学習

Wentao Shangguan, Yu Sun, Weijie Gan, Ulugbek S. Kamilov
高品質なフレーム補間のためのクロスビデオニューラル表現の学習
要約

本稿では、時間的動画補間(temporal video interpolation)という問題に着目する。この問題の目的は、与えられた2つの隣接フレームから新たな動画フレームを合成することにある。本研究では、ニューラルフィールド(Neural Fields, NF)に基づく初の動画補間手法として、Cross-Video Neural Representation(CURE)を提案する。ニューラルフィールドとは、複雑な3次元シーンをニューラルネットワークにより表現する近年の手法であり、コンピュータビジョン分野において広範な成功と応用を収めている。CUREは、動画を座標に基づくニューラルネットワークによってパラメータ化された連続関数として表現する。このネットワークの入力は時空間座標であり、出力は対応するRGB値となる。CUREは、合成動画における空間時間的一貫性を確保するために、入力フレームに条件付けられた新しいアーキテクチャを導入している。この手法は、最終的な補間品質の向上をもたらすだけでなく、複数の動画にまたがる事前知識(prior)の学習を可能にする。実験評価の結果、CUREは複数のベンチマークデータセットにおいて、動画補間の分野で最先端の性能を達成していることが示された。