17 天前

EHANet:一种用于人脸分割的有效分层聚合网络

{Xinglong Feng, Dingyu Xue, Ling Luo}
摘要

近年来,得益于深度卷积神经网络(DCNNs)的发展,人脸解析技术取得了显著进步。然而,该领域仍面临以下挑战:(1)现有先进框架在追求高性能的同时,往往难以满足实时性要求;(2)由于外观相似性导致像素标签分配错误,尤其在边界区域表现明显;(3)为促进多尺度预测,现有方法通常将深层特征与浅层特征进行融合,却未充分考虑二者之间的语义差距。针对上述问题,本文提出一种高效且有效的分层聚合网络——EHANet,以实现快速而精准的人脸解析。具体而言,我们首先提出一种阶段上下文注意力机制(SCAM),利用高层上下文信息按通道重要性对特征进行重新编码;其次,设计了一种语义差距补偿模块(SGCB),以确保分层信息的有效聚合;再次,引入加权边界感知损失函数,有效缓解了边界语义模糊的问题。在不依赖任何复杂技巧的前提下,结合轻量化主干网络,EHANet在CelebAMask-HQ数据集上取得了78.19%的mIoU,在Helen数据集上达到90.7%的F1分数,性能表现优异。此外,该模型在单张GTX 1080Ti显卡上,于640×640输入分辨率下可实现55 FPS的推理速度,并在256×256分辨率下进一步提升至300 FPS以上,具备良好的实时性,适用于实际应用场景。