18日前

バッチ混同正規化を用いた細粒度視覚分類

{Tyng-Luh Liu, Ming-Sui Lee, Ding-Jie Chen, Cheng-Yao Hong, Yen-Chi Hsu, Davi Geiger}
要約

我々は、細粒度視覚分類(FGVC)に対処するため、提案するバッチ混同正規化(Batch Confusion Norm: BCN)に基づく正則化概念を導入する。FGVC問題は、顕著なクラス間類似性とクラス内変動という二つの特徴により、効果的な分類器の学習が困難な課題として知られている。ペアワイズ混同エネルギーを正則化機構として用いることへの着想を得て、各トレーニングバッチにおいてクラス予測の混同を導入するBCN手法を開発した。これにより、細部の画像特徴を過度に探索することによる過学習の可能性を軽減できる。さらに、本手法は、アトラス空間的ピラミッドプーリング(Atrous Spatial Pyramid Pooling: ASPP)を組み込んだアテンションゲート付きCNNモデルにより実装されており、識別性の高い特徴と適切なアテンションの抽出を可能としている。本手法の有効性を実証するため、複数のベンチマークFGVCデータセットにおいて最先端の性能を報告するとともに、包括的なアブレーション比較も実施した。

バッチ混同正規化を用いた細粒度視覚分類 | 最新論文 | HyperAI超神経