
摘要
近期网络架构设计的一个趋势[30, 31, 14]是在整个网络中堆叠小滤波器(例如,1x1 或 3x3),因为与大内核相比,堆叠的小滤波器在计算复杂度相同的情况下更加高效。然而,在语义分割领域,我们需要执行密集的逐像素预测,发现在同时进行分类和定位任务时,大内核(以及有效的感受野)起着重要作用。遵循我们的设计原则,我们提出了一种全局卷积网络来解决语义分割中的分类和定位问题。我们还建议采用基于残差的边界细化方法以进一步优化对象边界。我们的方法在两个公开基准测试中取得了最先进的性能,并显著优于先前的结果,在PASCAL VOC 2012数据集上达到82.2%(对比之前的80.2%),在Cityscapes数据集上达到76.9%(对比之前的71.8%)。