17 天前

基于密集查询双边相关性的视频帧插值

Chang Zhou, Jie Liu, Jie Tang, Gangshan Wu
基于密集查询双边相关性的视频帧插值
摘要

视频帧插值(Video Frame Interpolation, VFI)旨在生成存在于实际帧之间的中间帧。基于光流的VFI算法通过估计中间运动场,对现有帧进行几何变换以生成中间帧。然而,现实世界中运动的复杂性以及参考帧的缺失,使得运动估计面临巨大挑战。许多最先进的方法通过显式建模相邻两帧之间的相关性,以提升运动估计的准确性。在常规方法中,高分辨率下相关性建模的感受野依赖于先前估计的运动场。这种感受野依赖性导致传统运动估计方法在处理小尺寸或高速运动物体时表现不佳。为更有效地建模帧间相关性并生成更精确的运动场,本文提出一种无感受野依赖的密集查询双边相关性(Densely Queried Bilateral Correlation, DQBC)机制,从而显著提升对小尺寸及快速运动物体的建模能力。在DQBC生成的运动场基础上,进一步结合上下文特征进行精细化修正与上采样。当运动场确定后,基于CNN的SynthNet网络负责合成最终的插值帧。实验结果表明,所提方法在精度和推理速度方面均优于当前最先进的技术。代码已开源,地址为:https://github.com/kinoud/DQBC。