Command Palette
Search for a command to run...
无需归一化的高性能大规模图像识别
无需归一化的高性能大规模图像识别
Andrew Brock Soham De Samuel L. Smith Karen Simonyan
摘要
批量归一化(Batch Normalization)是大多数图像分类模型中的关键组件,但其性能受到批大小依赖性以及样本间相互作用的诸多不利影响。尽管近期研究已成功训练出无需归一化层的深层ResNet模型,但这些模型在测试准确率上仍无法达到最佳批量归一化网络的水平,且在使用较大学习率或强数据增强时往往表现出不稳定性。在本研究中,我们提出了一种自适应梯度裁剪技术,有效克服了上述不稳定性,并设计出一类显著改进的无归一化ResNet(Normalizer-Free ResNets)。我们的小型模型在ImageNet上的测试准确率与EfficientNet-B7相当,同时训练速度最快可提升8.7倍;而最大规模的模型在ImageNet上实现了86.5%的全新最优Top-1准确率。此外,在对3亿张带标签图像的大规模数据集进行预训练后,将模型微调至ImageNet时,无归一化模型的表现显著优于对应的批量归一化模型,其中最佳模型达到了89.2%的准确率。相关代码已开源,地址为:https://github.com/deepmind/deepmind-research/tree/master/nfnets。