17日前
ジャイガパッチの段階的多粒度訓練を用いた細粒度視覚分類
Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma, Yi-Zhe Song, Jun Guo

要約
微細な視覚分類(Fine-grained visual classification, FGVC)は、クラス内における本質的に微妙なオブジェクト差異のため、従来の分類タスクよりもはるかに挑戦的な問題である。近年の研究では、主に最も識別的な部分や、より補完的な部分、さまざまな粒度の部分をいかに正確に特定するかに焦点を当てている。しかし、どの粒度が最も識別的であるか、また複数の粒度間で情報をどのように融合するかという点については、まだ十分な検討がなされていない。本研究では、これらの課題に対処するため、新しい微細な視覚分類フレームワークを提案する。具体的には、(i) 異なる粒度からの特徴を効果的に融合するプログレッシブな訓練戦略、および (ii) ネットワークが特定の粒度における特徴を学習するよう促すランダム・ジグソーパッチ生成器を提案する。これらの手法により、複数の標準的なFGVCベンチマークデータセットにおいて、最先端の性能を達成し、既存の手法を一貫して上回るか、同等の結果を示した。コードは、https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training にて公開される予定である。