2 个月前
学习用于目标检测的数据增强策略
Barret Zoph; Ekin D. Cubuk; Golnaz Ghiasi; Tsung-Yi Lin; Jonathon Shlens; Quoc V. Le

摘要
数据增强是训练深度学习模型的关键组成部分。尽管数据增强已被证明可以显著提高图像分类的性能,但其在目标检测领域的潜力尚未得到充分研究。考虑到为对象检测标注图像的额外成本,数据增强对于这一计算机视觉任务可能具有更大的重要性。在这项工作中,我们研究了数据增强对目标检测的影响。首先,我们展示了从图像分类中借鉴的数据增强操作可能有助于训练检测模型,但改进效果有限。因此,我们探讨了如何通过学习专门的数据增强策略来提高检测模型的泛化性能。重要的是,这些增强策略仅影响训练过程,在评估时不会改变已训练的模型。在COCO数据集上的实验表明,优化后的数据增强策略可将检测精度提高超过+2.3 mAP(平均精度均值),并使单一推理模型达到50.7 mAP的最先进水平。此外,我们在COCO上找到的最佳策略可以直接应用于其他检测数据集和模型,以提升预测准确性。例如,基于COCO识别出的最佳增强策略将PASCAL-VOC上的一个强大基线提高了+2.7 mAP。我们的结果还显示,学习到的数据增强策略优于最先进的架构正则化方法,即使是在考虑强大基线的情况下也是如此。使用所学策略进行训练的代码可在https://github.com/tensorflow/tpu/tree/master/models/official/detection在线获取。