
摘要
近期研究在利用全局上下文信息进行语义分割方面取得了显著进展,包括扩展感受野以及聚合金字塔特征表示。本文在此基础上进一步突破,提出一种基于共现特征的细粒度表征方法,引入了共现特征模型(Co-occurrent Feature Model),用于预测给定目标的共现特征分布。为充分挖掘共现特征中的语义上下文信息,我们构建了聚合共现特征模块(Aggregated Co-occurrent Feature, ACF Module),通过融合共现特征的概率与其共现上下文信息,实现对全局场景中细粒度共现上下文的建模。该模块能够学习到具有空间不变性的细粒度表征,有效捕捉跨场景的共现语义关系。实验结果表明,所提方法在FCN框架下显著提升了分割性能,在Pascal Context数据集上达到54.0%的mIoU,在Pascal VOC 2012数据集上达到87.2%的mIoU,在ADE20K数据集上达到44.89%的mIoU。相关源代码与完整系统将在论文发表后公开发布。