
摘要
在野外条件下捕获的图像中进行面部特征点定位是一个重要且具有挑战性的问题。当前最先进的方法主要围绕某些类型的深度卷积神经网络(DCNNs),如堆叠U-Net和Hourglass网络展开。在这项工作中,我们创新性地提出了用于此任务的堆叠密集U-Net。我们设计了一种新颖的尺度聚合网络拓扑结构和通道聚合构建模块,以提高模型容量而不牺牲计算复杂度和模型大小。通过在堆叠密集U-Net内部引入可变形卷积以及对外部数据变换使用连贯损失,我们的模型获得了对任意输入面部图像的空间不变性能力。我们在多个野外数据集上进行了大量实验,验证了所提出方法在极端姿态、夸张表情和严重遮挡条件下的鲁棒性。最后,我们展示了精确的3D面部对齐可以辅助姿态不变的人脸识别,在CFP-FP数据集上实现了新的最先进精度。