18 天前
基于批次混淆归一化的细粒度视觉分类
{Tyng-Luh Liu, Ming-Sui Lee, Ding-Jie Chen, Cheng-Yao Hong, Yen-Chi Hsu, Davi Geiger}
摘要
我们提出一种基于批量混淆归一化(Batch Confusion Norm, BCN)的正则化方法,以应对细粒度视觉分类(Fine-Grained Visual Classification, FGVC)任务。FGVC问题具有两个显著特征:类间相似性显著且类内差异较大,这使得构建有效的FGVC分类器面临巨大挑战。受成对混淆能量作为正则化机制的启发,我们提出了BCN技术,通过在每个训练批次中施加类别预测混淆,增强FGVC学习过程的鲁棒性,从而缓解因过度关注图像细节特征而导致的过拟合问题。此外,本方法基于带有注意力门控机制的卷积神经网络(CNN),并融合空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)模块,以提取更具判别性的特征并实现合理的注意力分布。为验证所提方法的有效性,我们在多个主流FGVC基准数据集上取得了当前最优的实验结果,并进行了详尽的消融实验分析,充分证明了该方法的优越性。