17 天前

基于核密度深度神经网络的人脸对齐

{ Qiang Ji, Hui Su, Lisha Chen}
基于核密度深度神经网络的人脸对齐
摘要

深度神经网络在许多计算机视觉任务中表现出色,例如人脸对齐。然而,当测试图像因分辨率低、遮挡或对抗性攻击而变得具有挑战性时,深度神经网络的预测精度会显著下降。因此,准确量化模型预测的不确定性至关重要。针对回归问题,通常采用在目标变量上假设高斯分布的概率神经网络来估计不确定性。但在现实世界中的计算机视觉任务中,这一高斯假设往往过于严格,难以刻画复杂的分布特性,如多模态或非对称分布。为此,本文提出构建一种基于核密度估计的深度神经网络,以建模更为通用的概率分布。具体而言,在人脸对齐任务中,我们将当前最先进的Hourglass神经网络改造为一个概率神经网络框架,其输出为关键点的概率图(landmark probability map)。该模型通过最大化条件对数似然进行训练。为进一步挖掘输出概率图的潜力,我们进一步将模型扩展为多阶段架构:前一阶段生成的logits图可作为输入传递至下一阶段,从而逐步提升关键点检测的准确性。在多个基准数据集上的大量实验表明,所提出的核密度神经网络在预测精度方面达到了与当前最先进的无约束深度学习方法相当甚至更优的性能。此外,该方法还能提供预测结果的随机不确定性(aleatoric uncertainty)估计,为模型决策的可靠性提供了可解释性支持。