
摘要
传统的显著性目标检测模型通常依赖手工设计的特征来构建对比度信息,并引入多种先验知识,再通过人工方式将这些特征进行融合。本文提出一种基于卷积神经网络的新型端到端深度分层显著性网络(Deep Hierarchical Saliency Network, DHSNet),用于显著性目标检测。DHSNet首先通过自动学习多种全局结构化显著性线索(包括全局对比度、目标性、紧凑性及其最优组合),实现粗粒度的全局预测;随后,引入一种新型的分层循环卷积神经网络(Hierarchical Recurrent Convolutional Neural Network, HRCNN),通过逐步整合局部上下文信息,对显著性图进行分层且渐进式的细节优化。整个网络架构遵循“全局到局部、粗略到精细”的处理流程。DHSNet直接使用完整图像及其对应的真值显著性掩码进行端到端训练。在测试阶段,只需将待检测图像直接前向输入网络,即可高效生成显著性图,无需依赖其他后处理技术。在四个基准数据集上的实验评估以及与另外11种先进算法的对比结果表明,DHSNet不仅在检测性能上展现出显著优势,而且在现代GPU上实现了高达23 FPS的实时处理速度。