2ヶ月前

詳細に悪魔を求める:細かい画像認識のための三線形注意サンプリングネットワークの学習

Heliang Zheng; Jianlong Fu; Zheng-Jun Zha; Jiebo Luo
詳細に悪魔を求める:細かい画像認識のための三線形注意サンプリングネットワークの学習
要約

微細な特徴(例えば、鳥の嘴や目)を学習することは、微細画像認識において重要な役割を果たします。既存の注意に基づくアプローチは、重要な部分を局所化し、その重要性を強調することで微細な詳細を学習しようとしますが、多くの場合、部分の数が限られていることと計算コストが重いという問題があります。本論文では、Trilinear Attention Sampling Network (TASN) を用いて効率的な教師-生徒方式で数百の部分提案からこのような微細な特徴を学習する方法を提案します。具体的には、TASN は 1) チャネル間関係をモデル化して注意マップを生成する三線形注意モジュール、2) 高解像度で注目された部分を強調する注意ベースのサンプラ、3) 重み共有と特徴保存戦略により部分特徴を全体的な特徴に蒸留する特徴蒸留器から構成されています。広範な実験結果は、iNaturalist-2017, CUB-Bird, Stanford-Cars データセットにおいて同等の設定のもとで最も競争力のある手法と比較しても TASN が最良の性能を示すことを確認しています。