17 天前
用于视频帧插值的增强型双向运动估计
Xin Jin, Longhai Wu, Guotao Shen, Youxin Chen, Jie Chen, Jayoon Koo, Cheul-hee Hahm

摘要
我们提出了一种新颖、简洁 yet 高效的基于运动的视频帧插值算法。现有的基于运动的插值方法通常依赖于预训练的光流模型或基于U-Net的金字塔网络进行运动估计,这类方法要么模型规模庞大,要么在处理复杂且大范围运动时能力受限。在本工作中,我们通过精心设计,将中间帧导向的前向映射(forward-warping)、轻量级特征编码器以及相关体积(correlation volume)集成到一个金字塔递归框架中,构建了一个紧凑的模型,能够同时估计输入帧之间的双向运动。该模型体积仅为PWC-Net的1/15,却在处理具有挑战性的运动场景时展现出更可靠且更灵活的性能。基于估计出的双向运动,我们将输入帧及其上下文特征前向映射至中间帧位置,并通过一个合成网络从映射后的表示中重建中间帧。所提方法在多种主流视频帧插值基准测试中均取得了优异的表现。代码与训练好的模型已开源,地址为:\url{https://github.com/srcn-ivl/EBME}。