
摘要
我们提出了一种紧凑而有效的卷积神经网络(CNN)模型用于光流计算,称为PWC-Net。PWC-Net的设计遵循了简单且广为人知的原则:金字塔处理、变形(warping)和成本体积的使用。在可学习的特征金字塔中,PWC-Net利用当前的光流估计值对第二幅图像的CNN特征进行变形处理。然后,它使用变形后的特征和第一幅图像的特征构建成本体积,该成本体积再由CNN处理以估计光流。与最近的FlowNet2模型相比,PWC-Net的规模缩小了17倍,训练也更加容易。此外,PWC-Net在MPI Sintel最终测试和KITTI 2015基准测试中超越了所有已发表的光流方法,在Sintel分辨率(1024x436)图像上运行速度约为35帧每秒。我们的模型可在https://github.com/NVlabs/PWC-Net 获取。