
摘要
我们通过研究如何在卷积神经网络中扩展池化的作用来解决显著目标检测的问题。基于U形架构,我们首先在自下而上的路径上构建了一个全局引导模块(Global Guidance Module, GGM),旨在为不同特征层次的层提供潜在显著目标的位置信息。为进一步设计了特征聚合模块(Feature Aggregation Module, FAM),以实现自顶向下路径中的粗粒度语义信息与细粒度特征的良好融合。通过在自顶向下路径的融合操作之后添加FAM,可以将GGM提供的粗粒度特征无缝地与多尺度特征结合。这两个基于池化的模块使得高层次语义特征能够逐步细化,从而生成细节丰富的显著图。实验结果表明,我们提出的方法能够更准确地定位显著目标,并且在细节上更加锐利,因此相比之前的最先进方法大幅提升了性能。此外,我们的方法还具有较快的速度,在处理 $300 \times 400$ 图像时可以达到每秒超过30帧(FPS)。代码可以在 http://mmcheng.net/poolnet/ 获取。