
摘要
全卷积网络(Fully Convolutional Network, FCN)在密集视觉识别任务中取得了巨大成功,例如场景分割。传统FCN的最后层通常是一个全局分类器(1×1卷积),用于将每个像素分类为语义标签。本文通过实验发现,这种全局分类器忽略了类内差异,可能导致次优的识别效果。在本工作中,我们提出一种条件分类器(conditional classifier)以替代传统的全局分类器。该分类器的卷积核会根据输入动态生成,从而实现条件化建模。新分类器的主要优势包括:(i)能够关注类内差异,显著增强密集识别能力;(ii)结构简单且灵活,可无缝集成到几乎任意FCN架构中以提升预测性能。大量实验表明,所提出的条件分类器在FCN架构上显著优于传统分类器。采用该条件分类器的框架(称为CondNet)在两个公开数据集上均取得了新的最先进(state-of-the-art)性能。相关代码与模型已开源,地址为:https://git.io/CondNet。