
摘要
数据增强通常用于增加训练数据量,防止过拟合并提高深度模型的性能。然而,在实际应用中,随机数据增强方法(如随机图像裁剪)效率较低,可能会引入许多无法控制的背景噪声。在本文中,我们提出了一种弱监督数据增强网络(WS-DAN),以探索数据增强的潜力。具体而言,对于每张训练图像,我们首先通过弱监督学习生成注意力图来表示对象的判别部分。接下来,我们在这些注意力图的引导下对图像进行增强,包括注意力裁剪和注意力丢弃。所提出的WS-DAN从两个方面提高了分类准确性。第一阶段,由于提取了更多判别部分的特征,图像可以被更好地识别。第二阶段,注意力区域提供了对象的精确位置信息,使我们的模型能够更近距离地关注对象,从而进一步提升性能。在常见的细粒度视觉分类数据集上的全面实验表明,我们的WS-DAN超越了现有最先进方法,证明了其有效性。