
摘要
近年来,自从Viola和Jones的开创性工作以来,人脸检测引起了广泛关注。尽管许多后续研究通过更强大的学习算法改进了这一领域的工作,但用于人脸检测的特征表示仍然无法满足在野外环境中有效且高效地处理具有较大外观变化的人脸的需求。为了解决这一瓶颈问题,我们将通道特征(channel features)的概念引入到人脸检测领域,将图像通道扩展到多种类型,如梯度幅值和方向梯度直方图等,从而以简单形式编码丰富信息。我们采用了一种称为聚合通道特征(aggregate channel features)的新变体,对特征设计进行了全面探索,并发现了一种多尺度版本的特征,其性能更佳。为了应对野外环境中人脸的姿态问题,我们提出了一种多视角检测方法,该方法包括得分重排序和检测调整。遵循Viola-Jones框架中的学习流程,使用聚合通道特征的多视角人脸检测器在AFW和FDDB测试集上表现出与最先进算法相当的性能,同时在VGA图像上运行速度达到42帧每秒(FPS)。