
摘要
语义分割是指为图像中的每个像素分配一个类别标签的任务。我们提出了一种基于区域的语义分割框架,该框架能够处理完全监督和弱监督的情况,并解决了三个常见问题:(1) 物体在不同尺度上出现,因此我们应该使用多尺度的区域。然而,这些区域存在重叠,导致在像素级别上产生冲突的类别预测。(2) 在现实数据集中,类别的频率分布极不平衡。(3) 每个像素只能被分配到一个类别,这导致了类别之间的竞争。我们通过一种联合校准方法解决了上述所有问题,该方法优化了一个定义在最终像素级输出标签上的多类别损失函数,而不仅仅是区域分类。我们的方法在完全监督和弱监督设置下均显著优于现有最先进的方法,在流行的SIFT Flow [18] 数据集上分别提高了6%和10%的性能。