
摘要
研究表明,用于目标识别的卷积神经网络对图像表现形式的变化具有脆弱性,这是因为模型学习过程倾向于依赖纹理块的低层统计特性,从而产生偏差。近期研究致力于通过在训练样本中应用风格迁移技术,以缓解对单一表现风格的过拟合问题,从而提升模型的鲁棒性。尽管这些方法在一定程度上改善了性能,但它们忽略了真实艺术作品中普遍存在的几何形状变化:艺术家为了艺术表现效果,常常对物体进行形变与扭曲。基于这一观察,我们提出一种新方法,通过联合增强训练数据的纹理多样性与几何多样性,以降低模型偏差。本质上,我们将视觉物体类别扩展至包含艺术家所采用的形状变化实例。具体而言,我们学习每类物体所对应的形变分布。结合基于广泛风格分布的纹理增强技术,实验结果表明,该方法在多个跨域基准测试中均显著提升了模型性能。