
摘要
语义分割领域由于卷积神经网络(CNNs)所学习的强大特征而取得了显著进展。当前领先的语义分割方法通过从掩码图像区域中提取CNN特征来利用形状信息。然而,这种策略在图像上引入了人为边界,可能会影响提取特征的质量。此外,在原始图像域上的操作需要对单张图像计算数千个网络,这非常耗时。本文提出了一种通过掩码卷积特征来利用形状信息的方法。提议的分割单元(例如,超像素)被视为卷积特征图上的掩码。这些分割单元的CNN特征直接从特征图中被掩码提取出来,并用于训练分类器以进行识别。我们进一步提出了一种联合方法,在同一框架下同时处理物体和“背景”(例如,草地、天空、水)。该方法在PASCAL VOC和新的PASCAL-CONTEXT基准测试中展示了最先进的结果,并且具有令人信服的计算速度。