19日前
細分視覚分類におけるクラス固有特徴の学習
Runkai Zheng, Zhijia Yu, Yinqi Zhang, Chris Ding, Hei Victor Cheng, Li Liu

要約
細粒度視覚分類(Fine-Grained Visual Classification, FGVC)における主要な課題は、クラス間の類似度が極めて高い複数のカテゴリを、微細な差異を捉える特徴を学習することによって区別することである。従来の交差エントロピーを用いた畳み込みニューラルネットワーク(CNN)は、FGVCにおいてこの課題に失敗しやすい。その理由は、クラス間不変な特徴(inter-class invariant features)を生成してしまう可能性があるためである。本研究では、情報理論的視点から、各カテゴリに対して特徴の一意性を強制することで、CNNの学習を正則化する新たなアプローチを提案する。この目的を達成するため、ゲーム理論の枠組みに基づいてミニマックス損失を定式化し、そのナッシュ均衡が本正則化目的と整合することを理論的に証明した。さらに、ミニマックス損失の解が冗長な特徴を生成する可能性を回避するため、選択された特徴マップペア間の正規化内積に基づく特徴冗長性損失(Feature Redundancy Loss, FRL)を導入し、提案するミニマックス損失を補完する。複数の代表的なベンチマークにおける優れた実験結果と可視化結果から、本手法は追加計算コストを伴わずベースラインモデルの性能を最大限に引き出し、最先端モデルと同等の性能を達成できることを示した。