
要約
細粒度視覚分類は、クラス内ばらつきが大きく、クラス間の差が小さいカテゴリを区別する分類タスクである。グローバルアプローチは画像全体を用いて分類を実行するのに対し、部位ベースのアプローチは、注目領域(attention)や部位情報といった追加の局所的情報を活用する。本研究では、初期予測値と勾配計算による特徴重要度の逆伝播を用いて、関連する画像領域を推定する新たな分類特化型部位推定手法を提案する。得られた部位は、事後的な分類知識によって選択されるだけでなく、自動的に決定される内在的な空間的範囲を持つ。これは、多くの部位ベースのアプローチや既存の真値部位アノテーション(ポイント座標のみを提供し、スケール情報は付与されない)と対照的である。我々は、広く用いられている複数の細粒度データセットにおける実験を通じて、抽出された部位特徴と組み合わせた当該部位選択手法の有効性を示した。