2 个月前
AutoAugment:从数据中学习增强策略
Ekin D. Cubuk; Barret Zoph; Dandelion Mane; Vijay Vasudevan; Quoc V. Le

摘要
数据增强是一种有效的技术,用于提高现代图像分类器的准确性。然而,当前的数据增强实现方法都是手动设计的。在本文中,我们描述了一种称为自动增强(AutoAugment)的简单程序,用于自动搜索改进的数据增强策略。在我们的实现中,我们设计了一个搜索空间,其中每个策略由许多子策略组成,每个小批量中的每张图像都会随机选择其中一个子策略进行应用。一个子策略包含两个操作,每个操作是一个图像处理函数(如平移、旋转或错切),以及这些函数被应用的概率和幅度。我们使用一种搜索算法来找到最佳策略,使得神经网络在目标数据集上获得最高的验证准确性。我们的方法在CIFAR-10、CIFAR-100、SVHN和ImageNet(不使用额外数据)上达到了最先进的准确性。在ImageNet上,我们实现了83.5%的Top-1准确率,比之前的记录83.1%提高了0.4%。在CIFAR-10上,我们达到了1.5%的错误率,比之前最先进的结果低了0.6%。我们发现的数据增强策略可以在不同数据集之间迁移。在ImageNet上学到的策略可以很好地迁移到其他数据集上,并取得显著的改进,例如牛津花卉、Caltech-101、牛津-IIT宠物、FGVC航空器和斯坦福汽车数据集。