
摘要
卷积神经网络(CNNs)的核心构建模块是卷积运算符,它使得网络能够在每一层的局部感受野内通过融合空间和通道信息来构建有信息量的特征。大量先前的研究探讨了这种关系中的空间成分,旨在通过提高整个特征层次结构中空间编码的质量来增强CNN的表示能力。在本研究中,我们则重点关注通道关系,并提出了一种新颖的架构单元,即“挤压与激励”(Squeeze-and-Excitation, SE)块,该单元通过显式建模通道之间的相互依赖关系来自适应地重新校准通道特征响应。我们展示了这些块可以堆叠在一起形成SENet架构,该架构在不同数据集上具有极强的泛化能力。此外,我们还证明了SE块在计算成本略有增加的情况下,能够显著提升现有最先进CNNs的性能。基于SENet的网络构成了我们在ILSVRC 2017分类竞赛中的提交方案,并最终获得了第一名,将前五错误率降低至2.251%,相比2016年的获胜者相对提高了约25%。模型和代码可在https://github.com/hujie-frank/SENet 获取。