17 天前

SIM-OFE:面向细粒度视觉分类的结构信息挖掘与目标感知特征增强

{Yuxin Peng, Jinglin Xu, Xiangteng He, Hongbo Sun}
摘要

细粒度视觉分类(Fine-Grained Visual Categorization, FGVC)旨在区分粗粒度类别下的多个子类别。由于不同子类别之间存在细微的类间差异,FGVC任务具有较高的挑战性。现有方法主要聚焦于学习显著的视觉模式,却忽视了如何捕捉物体内部结构信息,导致难以获取物体内部完整的判别区域,从而限制了FGVC性能的提升。为解决上述问题,本文提出一种结构信息挖掘与面向物体的特征增强方法(Structure Information Mining and Object-aware Feature Enhancement, SIM-OFE),旨在探索视觉对象的内部结构组成及其外观特征。具体而言,我们首先提出一种简单而有效的混合感知注意力模块,通过全局与局部显著性分析实现对视觉对象的精准定位。随后,设计了一种结构信息挖掘模块,用于建模物体内部关键区域的分布特性及其上下文关系,从而突出整个物体及具有判别性的区域,以更好地区分细微差异。最后,提出一种面向物体的特征增强模块,以注意力耦合的方式融合全局与局部判别性特征,构建强大的细粒度识别视觉表征。在三个主流FGVC基准数据集上的大量实验表明,所提出的SIM-OFE方法能够达到当前最优的性能水平,显著提升了细粒度视觉分类的准确率与鲁棒性。

SIM-OFE:面向细粒度视觉分类的结构信息挖掘与目标感知特征增强 | 最新论文 | HyperAI超神经