
摘要
大多数实例分割模型由于在预处理阶段引入了候选区域估计(RPN)或在后处理阶段采用非极大值抑制(NMS),无法实现端到端训练。为此,本文提出一种新型的端到端实例分割方法——ISDA。该方法将实例分割任务重新建模为预测一组目标掩码,这些掩码通过结合可学习的位置感知卷积核与目标特征,利用传统卷积操作生成。其中,卷积核与特征由一种具有多尺度表征能力的可变形注意力网络进行联合学习。得益于所引入的集合预测机制,该方法无需依赖非极大值抑制(NMS)。实验结果表明,ISDA在MS-COCO数据集上相比Mask R-CNN(强基准模型)取得了2.6个百分点的性能提升,并在与近期先进模型的对比中展现出领先水平。代码即将开源。