
摘要
深度卷积神经网络(CNNs)已在计算机视觉的诸多任务中取得成功应用,包括显著性目标检测。为实现对显著性目标的精准检测与分割,需同时提取并融合高层语义特征与低层精细细节。然而,这一目标对CNN而言构成挑战,因为反复进行的下采样操作(如池化和卷积)会导致图像初始分辨率显著下降,从而造成空间细节与精细结构的丢失。为解决此问题,本文提出在前馈神经网络中引入一种新型金字塔池化模块(pyramid pooling module)以及多阶段细化机制,以提升显著性检测性能。首先,所提出的深度前馈网络生成一个粗略的预测图,其中包含大量细节信息的损失;随后,通过集成局部上下文信息的细化网络,以分阶段的方式逐步优化主干分支生成的显著性图。此外,引入金字塔池化模块以实现基于不同区域的全局上下文信息聚合。在五个基准数据集上的实验评估表明,所提方法在性能上优于当前最先进的技术。