11 天前
基于有限标注数据的面部属性识别中的空间-语义关系学习
{Hanzi Wang, Chunhua Shen, Jing-Hao Xue, Si Chen, Yan Yan, Ying Shu}

摘要
近年来,深度学习在人脸属性识别(Facial Attribute Recognition, FAR)任务中取得了卓越成果,通常依赖大规模标注数据进行训练。然而,在众多实际应用中,可用的标注数据极为有限,导致现有大多数基于深度学习的FAR方法性能显著下降。为解决这一问题,本文提出一种名为空间-语义块学习(Spatial-Semantic Patch Learning, SSPL)的新方法。SSPL的训练过程分为两个阶段。第一阶段,设计三项辅助任务——块旋转任务(Patch Rotation Task, PRT)、块分割任务(Patch Segmentation Task, PST)和块分类任务(Patch Classification Task, PCT),联合利用大规模未标注人脸数据学习图像的时空语义关系,从而获得一个强大的预训练模型。其中,PRT采用自监督学习方式,挖掘人脸图像中的空间结构信息;PST与PCT则分别基于人脸解析模型,捕捉图像的像素级与图像级语义特征。第二阶段,将第一阶段所学习到的空间-语义知识迁移至目标任务——人脸属性识别。通过该知识迁移机制,仅需少量标注数据即可对预训练模型进行微调,显著降低对大规模标注数据的依赖。大量实验与对比分析表明,所提方法在多种基准数据集上均显著优于当前主流先进方法,验证了其有效性与优越性。