1 个月前

Res2Net:一种新的多尺度骨干网络架构

Shang-Hua Gao; Ming-Ming Cheng; Kai Zhao; Xin-Yu Zhang; Ming-Hsuan Yang; Philip Torr
Res2Net:一种新的多尺度骨干网络架构
摘要

在众多视觉任务中,多尺度特征表示具有重要意义。近年来,骨干卷积神经网络(CNNs)的不断进步展示了更强的多尺度表示能力,从而在广泛的应用中实现了持续的性能提升。然而,大多数现有方法以层的方式表示多尺度特征。本文提出了一种新型的CNN构建模块,即Res2Net,通过在一个单一的残差块内构建层次化的类似残差连接来实现这一目标。Res2Net在细粒度级别上表示多尺度特征,并扩大了每个网络层的感受野范围。所提出的Res2Net模块可以嵌入到最先进的骨干CNN模型中,例如ResNet、ResNeXt和DLA。我们在这些模型上评估了Res2Net模块,并在广泛使用的数据集(如CIFAR-100和ImageNet)上展示了相对于基线模型的一致性能提升。进一步的消融研究和在代表性计算机视觉任务(即目标检测、类别激活映射和显著物体检测)上的实验结果进一步验证了Res2Net相对于最先进基线方法的优势。源代码和训练好的模型可在https://mmcheng.net/res2net/ 获取。