
摘要
许多成功的学习目标,如最小化Dice损失和交叉熵损失,已在分割任务中实现了前所未有的突破。然而,除了这些语义层面的度量之外,本文旨在将位置监督引入语义分割任务。基于这一思路,我们提出了一种位置感知上采样(Location-aware Upsampling, LaU)方法,该方法通过可学习的偏移量自适应地优化插值坐标。进一步地,我们构建了位置感知损失函数,通过引导像素向分类性能良好的位置移动来提升分割精度。LaU模块结合了偏移量预测与插值操作,能够端到端地训练,从粗粒度到细粒度逐步生成每个位置的置信度得分。在位置感知损失的引导下,该模块可作为即插即用的替代方案,无缝替换传统的上采样方式(如双线性插值),从而进一步提升当前主流编码器-解码器架构的性能。大量实验结果表明,该方法在多个基准数据集上均实现了对现有最先进方法的一致性提升。相关代码已开源,地址为:https://github.com/HolmesShuan/Location-aware-Upsampling-for-Semantic-Segmentation。