
摘要
在本文中,我们介绍了一种新颖的网络,该网络使用共享编码器生成语义分割、实例分割和部件分割,并有效地将它们融合以实现全景部件分割。统一这三种分割问题可以实现相互改进和一致的表示学习。为了高效地融合所有三个分支的预测结果,我们引入了一个无参数的联合融合模块,该模块动态平衡各分支的输出并将其融合以生成全景部件分割。我们的方法在Cityscapes Panoptic Parts (CPP) 和Pascal Panoptic Parts (PPP) 数据集上进行了评估。对于CPP数据集,我们提出的带有联合融合的模型在所有区域和具有部件的片段上的PartPQ分别超过了先前最先进方法1.6和4.7个百分点。在PPP数据集上,我们的联合融合方法在PartPQ上比使用先前自顶向下合并策略的模型高出3.3个百分点,在可分隔类别的PartPQ上则高出10.5个百分点。