17 天前

CAR:面向语义分割的类别感知正则化

Ye Huang, Di Kang, Liang Chen, Xuefei Zhe, Wenjing Jia, Xiangjian He, Linchao Bao
CAR:面向语义分割的类别感知正则化
摘要

近年来,诸如OCR和CPNet等分割方法在利用像素特征的同时引入了“类别级别”信息,显著提升了现有网络模块的精度。然而,这些方法仅将提取的类别级信息简单地与像素特征拼接,未能显式地利用该信息以优化像素表示的学习。此外,这些方法基于粗粒度的掩码预测来学习软类别中心,容易导致误差累积。针对这一问题,本文提出一种通用的类别感知正则化(Class-Aware Regularization, CAR)方法,旨在更有效地利用类别级别信息。该方法受人类在不同上下文中仍能独立识别物体这一认知机制的启发,在特征学习过程中同时优化类内方差与类间距离。为此,我们设计了三种新颖的损失函数:第一种损失函数促使同一类别内部的特征表示更加紧凑;第二种损失函数直接最大化不同类别中心之间的距离;第三种损失函数进一步拉大类别中心与像素之间的距离。值得注意的是,本文所采用的类别中心直接由真实标签(ground truth)生成,而非依赖于易出错的粗略预测结果,从而提升了中心表示的准确性。所提方法可无缝集成至大多数现有分割模型的训练过程中,包括OCR和CPNet,且在不增加推理开销的前提下显著提升模型精度。在多个基准数据集上进行的大量实验与消融研究结果表明,CAR方法可使所有基线模型的mIOU指标提升最高达2.23%,并展现出优异的泛化能力。完整代码已开源,地址为:https://github.com/edwardyehuang/CAR。