17 天前

细节在于通道:用于细粒度图像分类的互通道损失

Dongliang Chang, Yifeng Ding, Jiyang Xie, Ayan Kumar Bhunia, Xiaoxu Li, Zhanyu Ma, Ming Wu, Jun Guo, Yi-Zhe Song
细节在于通道:用于细粒度图像分类的互通道损失
摘要

解决细粒度图像分类的关键在于识别出对应细微视觉特征的判别性局部区域。近年来,研究取得了显著进展,涌现出一系列专为学习部件级别判别性特征表示而设计的复杂网络结构。本文表明,无需采用过于复杂的网络架构或训练机制,仅通过一个单一损失函数即可有效捕捉细微特征——这便是我们的核心发现。其关键在于:我们从早期阶段即深入分析各个特征通道,而非沿用传统方法中从整合后的特征图入手的策略。本文提出一种名为互通道损失(Mutual-Channel Loss, MC-Loss)的新损失函数,由两个针对通道的特定组件构成:判别性组件与多样性组件。判别性组件通过一种新颖的通道级注意力机制,促使属于同一类别的所有特征通道具备强判别能力;多样性组件则进一步约束各通道,使其在空间维度上相互排斥,从而实现通道间的差异化表达。最终结果是,每个特征通道都能独立反映特定类别下不同的局部判别性区域。MC-Loss支持端到端训练,无需任何边界框或部件标注信息,在推理阶段即可生成高度判别性的特征区域。实验结果表明,将MC-Loss应用于常见的基础网络之上,可在四个主流细粒度分类数据集(CUB-Birds、FGVC-Aircraft、Flowers-102 和 Stanford-Cars)上均达到当前最优性能。消融实验进一步验证了MC-Loss相较于其他近期提出的通用视觉分类损失函数,在两种不同基础网络上的优越性。代码已开源,地址为:https://github.com/dongliangchang/Mutual-Channel-Loss