
摘要
在不受约束的环境中进行人脸检测和对齐具有挑战性,因为存在多种姿态、光照条件和遮挡问题。近期研究表明,深度学习方法在这两个任务上可以实现令人印象深刻的效果。本文提出了一种利用它们之间固有相关性的深度级联多任务框架,以提升其性能。具体而言,我们的框架采用了三级精心设计的深度卷积网络级联结构,以从粗到精的方式预测人脸和地标位置。此外,在学习过程中,我们提出了一种新的在线难样本挖掘策略(online hard sample mining),该策略可以在无需人工选择样本的情况下自动提高性能。我们的方法在人脸检测方面超越了现有最先进技术,在具有挑战性的FDDB和WIDER FACE基准测试中表现出色;同时,在人脸对齐方面也优于AFLW基准测试中的其他方法,且保持了实时性能。