摘要
平面单应性估计是指在两幅图像之间计算像素点的双射线性映射问题。尽管该问题已有研究采用卷积神经网络(CNN)进行处理,但现有方法通常仅通过一个全连接层后接密集层来回归四个角点的位置。这种向量表示方式破坏了角点之间清晰的空间顺序关系。此外,四个点是计算单应性所需的最小数量,因此此类方法对噪声和扰动较为敏感。本文提出了一种概念简洁、可靠且通用的单应性估计框架。与以往方法不同,我们将其建模为透视场(Perspective Field, PF),该模型捕捉了单应性本质——像素到像素的双射关系。所提出的全卷积残差网络PFNet能够自然地学习该透视场,从而保持每个像素的空间顺序。更重要的是,由于透视场可直接提供每个像素的位移信息,因此能够利用密集对应关系实现鲁棒的单应性估计。实验结果表明,所提方法在精度上优于传统基于对应点的方法以及当前最先进的CNN方法,同时网络规模更小。此外,该任务的新参数化方式具有通用性,可被任意全卷积网络(Fully Convolutional Network, FCN)架构所实现。