
摘要
我们提出了一种端到端的学习方法,用于全景分割(panoptic segmentation),这是一种将实例分割(things)和语义分割(stuff)统一起来的新任务。我们的模型TASCNet利用共享骨干网络的特征图,在单次前向传播过程中同时预测实例和语义分割结果。我们通过一个全局的实例和语义二值掩模显式地约束这两个输出分布,以确保跨任务的一致性。我们提出的统一网络在多个全景分割基准测试中表现出色,同时在单独的语义分割和实例分割任务上也具有竞争力。
我们提出了一种端到端的学习方法,用于全景分割(panoptic segmentation),这是一种将实例分割(things)和语义分割(stuff)统一起来的新任务。我们的模型TASCNet利用共享骨干网络的特征图,在单次前向传播过程中同时预测实例和语义分割结果。我们通过一个全局的实例和语义二值掩模显式地约束这两个输出分布,以确保跨任务的一致性。我们提出的统一网络在多个全景分割基准测试中表现出色,同时在单独的语义分割和实例分割任务上也具有竞争力。