17 天前

通过拼图块的渐进式多粒度训练实现细粒度视觉分类

Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma, Yi-Zhe Song, Jun Guo
通过拼图块的渐进式多粒度训练实现细粒度视觉分类
摘要

细粒度视觉分类(Fine-grained Visual Classification, FGVC)由于类别内部对象之间的差异极为细微,相较于传统分类任务更具挑战性。近期研究主要聚焦于如何定位最具判别性的局部区域、更具互补性的区域,以及不同粒度级别的区域。然而,关于哪些粒度级别最具判别性,以及如何有效融合多粒度信息的问题,仍缺乏充分探索。为此,本文提出一种新颖的细粒度视觉分类框架,以应对上述挑战。具体而言,我们提出:(i)一种渐进式训练策略,能够有效融合来自不同粒度级别的特征;(ii)一种随机拼图块生成器(random jigsaw patch generator),可引导网络在特定粒度级别上学习更具判别性的特征。在多个标准FGVC基准数据集上,所提方法均取得了当前最优的性能表现,且在多数情况下显著优于现有方法,或达到具有竞争力的水平。代码将开源,地址为:https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training。