
摘要
我们提出了一种简单且高度模块化的图像分类网络架构。该网络通过重复一个构建模块来构建,该模块聚合了一组具有相同拓扑结构的变换。我们的简单设计导致了一个只有少数超参数需要设置的均匀多分支架构。这一策略揭示了一个新的维度,我们称之为“基数”(cardinality)(变换集的大小),除了深度和宽度这两个维度之外,它也是一个关键因素。在ImageNet-1K数据集上,我们通过实验证明,即使在保持复杂度不变的条件下,增加基数也能提高分类准确性。此外,当增加模型容量时,增加基数比加深或加宽网络更为有效。我们所提出的模型命名为ResNeXt,在ILSVRC 2016分类任务中获得了第二名的成绩。我们进一步在ImageNet-5K数据集和COCO检测数据集上研究了ResNeXt,结果同样优于其对应的ResNet模型。代码和模型已在线公开提供。