2ヶ月前
ペアワイズ混同行列を用いた細分化視覚分類
Abhimanyu Dubey; Otkrist Gupta; Pei Guo; Ramesh Raskar; Ryan Farrell; Nikhil Naik

要約
微細視覚分類(Fine-Grained Visual Classification: FGVC)のデータセットは、少量のサンプルとクラス内の大きな変動、およびクラス間の類似性を含んでいます。従来の研究では、局所化やセグメンテーション技術を使用してクラス内の変動に対処してきましたが、クラス間の類似性も特徴学習に影響を与え、分類性能を低下させる可能性があります。本研究では、FGVCタスクにおけるエンドツーエンドのニューラルネットワーク訓練に新しい最適化手順を用いてこの問題に対処します。当該手順であるペアワイズ混同行列(Pairwise Confusion: PC)は、活性化に意図的に混乱を導入することで過学習を抑制します。PC正則化により、最も広く使用されている6つのFGVCデータセットで最先端の性能を得ることができました。また、局所化能力の向上も示しました。PCは実装が簡単であり、訓練中に過度なハイパーパラメータ調整が必要ではなく、テスト時に著しいオーバーヘッドも加えません。