
摘要
面部属性(如年龄、吸引力)估计性能近年来得益于卷积神经网络的广泛应用而显著提升。然而,现有方法在训练目标与评估指标之间存在不一致性,可能导致模型性能并非最优。此外,这些方法通常采用参数量庞大的图像分类或人脸识别模型,带来了高昂的计算开销和存储负担。本文首先分析了两种前沿方法(Ranking-CNN 与 DLDL)之间的内在联系,揭示出 Ranking 方法实际上隐式地学习了标签分布。这一发现首次将两种主流的先进方法统一至 DLDL 框架之下。其次,为缓解训练目标与评估指标之间的不一致问题,并降低资源消耗,本文设计了一种轻量级网络架构,提出一种统一框架,能够联合学习面部属性的分布特征并回归属性值。所提方法在面部年龄与吸引力估计任务上均取得了显著成效。实验结果表明,本方法仅使用单个模型,在参数量减少 36 倍、推理速度提升 3 倍的前提下,仍实现了新的最先进性能。此外,即使将参数量进一步压缩至 0.9M(对应约 3.8MB 磁盘存储空间),该方法仍能取得与当前最先进方法相当的性能表现。