
摘要
由于昂贵的像素级标签的限制,息肉分割模型面临着数据短缺的问题,并且其泛化能力受到损害。相比之下,息肉边界框注释的成本要低得多,也更容易获取。因此,为了降低标注成本,我们提出了一种完全基于边界框注释的弱监督息肉分割模型(即WeakPolyp)。然而,粗略的边界框包含过多的噪声。为了避免干扰,我们引入了掩码到边界框(Mask-to-Box, M2B)转换方法。通过监督预测结果的外边界框掩码而不是预测本身,M2B显著缓解了粗略标签与精确预测之间的不匹配问题。但是,M2B仅提供稀疏监督,导致预测结果不唯一。因此,我们进一步提出了尺度一致性(Scale Consistency, SC)损失以实现密集监督。通过显式对齐同一图像在不同尺度下的预测结果,SC损失大大减少了预测结果的变化。需要注意的是,我们的WeakPolyp是一种即插即用模型,可以轻松移植到其他有吸引力的骨干网络中。此外,所提出的模块仅在训练过程中使用,在推理时不会带来任何计算成本。大量实验表明,我们提出的WeakPolyp具有有效性,在不需要任何掩码注释的情况下,其性能令人惊讶地与全监督模型相当。