
摘要
本文通过在马尔可夫随机场(MRF)中融入丰富信息,包括高阶关系和标签上下文混合,探讨了语义图像分割问题。与以往利用迭代算法优化MRF的研究不同,我们提出了一种卷积神经网络(CNN),即深度解析网络(DPN),该网络能够在单次前向传递中实现确定性的端到端计算。具体而言,DPN扩展了现代CNN架构以建模一元项,并精心设计了额外的层来近似均场算法(MF)对二元项进行建模。该方法具有多个吸引人的特性。首先,与近期结合CNN和MRF的工作相比,这些工作在反向传播过程中每张训练图像都需要多次MF迭代,而DPN仅需近似一次MF迭代即可达到高性能。其次,DPN能够表示多种类型的二元项,使得许多现有研究成为其特例。第三,DPN使均场算法更容易在图形处理单元(GPU)上并行化和加速。我们在PASCAL VOC 2012数据集上对DPN进行了全面评估,结果显示单一的DPN模型即可获得最新的分割精度记录。