17日前

BiFormer:4K動画フレーム補間におけるバイラテラルトランスフォーマーを用いたバイラテラル運動推定の学習

Junheum Park, Jintae Kim, Chang-Su Kim
BiFormer:4K動画フレーム補間におけるバイラテラルトランスフォーマーを用いたバイラテラル運動推定の学習
要約

本稿では、双方向変換器(BiFormer)を基盤とする新しい4K動画フレーム補間手法を提案する。本手法は、3段階の処理を実行する:グローバルな運動推定、局所的な運動補正、およびフレーム合成。まず、グローバルな運動推定において、粗いスケールで対称的な双方向運動場を予測する。この目的のために、初めてトランスフォーマーに基づく双方向運動推定器としてBiFormerを提案する。次に、ブロック単位の双方向コストボリューム(BBCV)を用いて、得られたグローバルな運動場を効率的に補正する。最後に、補正された運動場を用いて入力フレームをワープし、それらをブレンドすることで中間フレームを合成する。広範な実験により、提案手法であるBiFormerが4Kデータセットにおいて優れた補間性能を達成することが示された。ソースコードは以下のURLで公開されている:https://github.com/JunHeum/BiFormer。

BiFormer:4K動画フレーム補間におけるバイラテラルトランスフォーマーを用いたバイラテラル運動推定の学習 | 最新論文 | HyperAI超神経