17 天前
ResNeSt:分割注意力网络
Hang Zhang, Chongruo Wu, Zhongyue Zhang, Yi Zhu, Haibin Lin, Zhi Zhang, Yue Sun, Tong He, Jonas Mueller, R. Manmatha, Mu Li, Alexander Smola

摘要
众所周知,特征图注意力机制与多路径表征在视觉识别任务中具有重要意义。本文提出了一种模块化架构,通过在不同网络分支上应用通道注意力机制,充分挖掘其在捕捉跨特征交互以及学习多样化表征方面的优势。该设计形成了一种简洁且统一的计算模块,仅需少量参数即可进行有效配置。所提出的模型名为ResNeSt,在图像分类任务中,其在准确率与延迟之间的权衡表现优于EfficientNet。此外,ResNeSt在多个公开基准数据集上作为主干网络进行迁移学习时,均取得了优异的性能,已被用于COCO-LVIS挑战赛的优胜方案中。完整的系统代码及预训练模型均已公开发布。