摘要
本文提出了一种面向人脸解析任务的深度学习网络设计方法,在保持高精度的同时实现了实时推理速度。通过分析通用图像解析任务与人脸解析任务之间的差异,我们首先重新审视了传统全卷积网络(FCN)的结构,并对其进行改进,以更好地适应人脸解析任务的独特特性。特别地,本文提出了“归一化感受野”(Normalized Receptive Field)的概念,为网络结构设计提供了更深入的理论洞察。随后,我们引入了一种新型损失函数——统计上下文损失(Statistical Contextual Loss),该函数能够融合更丰富的上下文信息,并在训练过程中对特征表示进行有效正则化。为进一步提升模型推理效率,本文还提出了一种半监督知识蒸馏方案,可将知识高效地迁移至轻量化网络中。在LFW和Helen数据集上的大量实验表明,所提出的新型设计在性能与效率两方面均展现出显著优势。