11 天前
UniformAugment:一种无搜索的概率数据增强方法
Tom Ching LingChen, Ava Khonsari, Amirreza Lashkari, Mina Rafi Nazari, Jaspreet Singh Sambee, Mario A. Nascimento

摘要
扩充训练数据集已被证明能够提升多种计算机视觉任务的学习效果。理想的增强方法应生成具有更高变异性的同时,仍保持原始数据集统计特性的增强数据集。一些方法,如AutoAugment和Fast AutoAugment,引入了搜索阶段,以针对特定模型和数据集寻找一组合适的增强策略。然而,这一过程带来了巨大的计算开销,耗时可达数千GPU小时。近期提出的RandAugment通过用少量超参数近似搜索空间,显著加速了搜索过程,但仍需付出不可忽视的调参成本。本文在假设增强空间近似满足分布不变性(distribution invariance)的前提下,证明了在连续增强变换空间中进行均匀采样,即可训练出高效性能的模型。基于这一发现,我们提出UniformAugment——一种全自动数据增强方法,完全避免了搜索阶段。除了阐述支撑该方法的理论基础外,我们还通过标准图像分类数据集和成熟模型的实验,验证了UniformAugment在性能上可与前述方法相媲美,同时因其无需任何搜索过程,展现出极高的计算效率。