2 个月前

基于卷积神经网络和三维模型的端到端人脸检测

Yunzhu Li; Benyuan Sun; Tianfu Wu; Yizhou Wang
基于卷积神经网络和三维模型的端到端人脸检测
摘要

本文提出了一种在自然场景中进行人脸检测的方法,该方法在一个端到端的多任务判别学习框架中集成了卷积神经网络(ConvNet)和三维平均人脸模型。三维平均人脸模型是预先定义并固定的(例如,我们使用了AFLW数据集中提供的模型)。卷积神经网络由两个部分组成:(i) 人脸提议组件通过估计面部关键点和每个预测关键点相对于三维平均人脸模型的3D变换(旋转和平移)参数来计算人脸边界框提议。(ii) 人脸验证组件通过基于面部关键点配置池化对提议进行剪枝和精炼,从而计算检测结果。所提出的方法解决了将最先进的通用物体检测卷积神经网络(如更快的R-CNN)应用于人脸检测时存在的两个问题:(i) 一个问题是通过利用三维平均人脸模型消除了区域提议网络(RPN)中预定义锚框的启发式设计。(ii) 另一个问题是以配置池化层替代通用的RoI(感兴趣区域)池化层,以尊重底层物体结构。多任务损失函数包含三个项:分类Softmax损失以及面部关键点和人脸边界框的位置平滑L1损失[14]。在实验中,我们的卷积神经网络仅在AFLW数据集上进行训练,并在经过微调后在FDDB基准测试集上进行测试,在未经过微调的情况下在AFW基准测试集上进行测试。所提出的方法在这两个基准测试集中均取得了非常具有竞争力的最先进性能。