6 个月前

摘要

弱监督语义分割（Weakly-Supervised Semantic Segmentation, WSSS）旨在仅使用图像级标签（image-level supervision）的图像数据训练语义分割模型。由于缺乏精确的像素级标注，现有方法通常通过优化类似类别激活图（CAM-like）的热图来生成伪掩码（pseudo masks），用于训练分割模型。然而，生成的热图往往仅聚焦于目标类别中具有判别性的图像区域，或错误地包含与目标共现的背景区域，导致语义对齐不充分。为解决上述问题，本文提出一种面向弱监督语义分割的语义提示学习框架——SemPLeS（Semantic Prompt Learning for WSSS）。该框架通过学习有效提示（prompts），引导CLIP模型的潜在空间（latent space），从而增强分割区域与目标类别之间的语义一致性。具体而言，我们提出两种关键技术：对比提示学习（Contrastive Prompt Learning）与提示引导的语义精炼（Prompt-guided Semantic Refinement），以学习能够充分描述目标类别特征并有效抑制其共现背景的提示。由此，SemPLeS能够实现更优的物体区域与类别标签之间的语义对齐，从而生成高质量的伪掩码，用于后续分割模型的训练。所提出的SemPLeS框架在标准WSSS基准数据集PASCAL VOC 2012和MS COCO 2014上均取得了具有竞争力的性能，并展现出与现有其他WSSS方法的良好兼容性。代码已开源：https://github.com/NVlabs/SemPLeS。

源 PDF 查看代码