
摘要
我们提出了一种卷积块注意力模块(Convolutional Block Attention Module, CBAM),这是一种简单而有效的注意力机制,适用于前馈卷积神经网络。给定一个中间特征图,我们的模块依次在两个独立的维度上推断注意力图,即通道和空间维度,然后将这些注意力图乘以输入特征图,以实现自适应特征精炼。由于CBAM是一个轻量级且通用的模块,它可以无缝集成到任何CNN架构中,并且几乎不会增加额外开销,同时可以与基础CNN模型一起进行端到端训练。我们通过在ImageNet-1K、MS COCO检测和VOC 2007检测数据集上的大量实验验证了CBAM的有效性。实验结果表明,在不同的模型中,CBAM在分类和检测性能上均表现出一致的提升,证明了其广泛的适用性。代码和模型将公开发布。