
摘要
可变形卷积网络(Deformable Convolutional Networks)的优越性能源于其能够适应物体的几何变化。通过对这种自适应行为的研究,我们观察到,尽管其神经特征的空间支持比常规卷积网络(ConvNets)更贴近物体结构,但这种支持可能会超出感兴趣区域,导致特征受到无关图像内容的影响。为了解决这一问题,我们提出了一种改进的可变形卷积网络的重新表述方法,通过增强建模能力和强化训练来提高其对相关图像区域的关注能力。建模能力的提升是通过在网络中更全面地整合可变形卷积,并引入一种调制机制以扩展变形建模的范围实现的。为了有效利用这种增强的建模能力,我们通过提出的特征模仿方案指导网络训练,帮助网络学习反映R-CNN特征的目标关注和分类能力的特征。借助这些贡献,新版本的可变形卷积网络在原始模型的基础上显著提升了性能,并在COCO基准测试中取得了物体检测和实例分割领域的领先结果。