摘要
近年来,由于在人脸化妆、人脸图像生成等众多应用中的巨大潜力,人脸解析(face parsing)任务受到了越来越多的关注。本文从两个方面对人脸解析任务做出了贡献。首先,我们提出了一种高效的人脸像素级标注框架,并构建了一个大规模的、基于关键点引导的人脸解析数据集——LaPa(Landmark-guided face Parsing dataset)。该数据集包含超过22,000张人脸图像,涵盖了丰富的表情、姿态和遮挡变化。每张图像均配有11类像素级语义标签图以及106个关键点地标。该数据集已向学术界公开,旨在推动人脸解析技术的发展。其次,本文提出了一种简单而有效的边界注意力语义分割方法(Boundary-Attention Semantic Segmentation, BASS),该方法采用三分支网络结构,并设计了精心构建的损失函数,以充分挖掘边界信息。在我们构建的LaPa基准数据集以及公开的Helen数据集上的大量实验结果表明,所提方法在人脸解析任务中具有显著优势。