2ヶ月前

バッチ ドロップブロック ネットワークを用いた人物再識別およびその他の応用

Zuozhuo Dai; Mingqiang Chen; Xiaodong Gu; Siyu Zhu; Ping Tan
バッチ ドロップブロック ネットワークを用いた人物再識別およびその他の応用
要約

人物再識別タスクでは、姿勢の変化や遮蔽物による問題がしばしば発生し、CNNの学習時に注意深い局所特徴量が抑制されることがあります。本論文では、そのような問題を解決するために、Batch DropBlock (BDB) ネットワークを提案します。このネットワークは、グローバルブランチとして通常のResNet-50と、特徴量ドロップブランチからなる2つのブランチで構成されています。グローバルブランチは全体的な重要な表現をエンコードします。一方、特徴量ドロップブランチにはBatch DropBlockと呼ばれる注意深い特徴量学習モジュールが含まれており、バッチ内のすべての入力特徴マップの同じ領域を無作為にドロップすることで、局所領域の注意深い特徴量学習を強化します。その後、ネットワークは両方のブランチからの特徴量を連結し、より包括的かつ空間的に分散した特徴表現を提供します。本手法は単純ながら、人物再識別において最先端の性能を達成しており、一般的な計量学習タスクにも適用可能です。例えば、CUHK03-DetectデータセットではRank-1精度76.4%、Stanford Online ProductsデータセットではRecall-1スコア83.0%を達成しており、既存の研究よりも大幅に優れた結果(6%以上)を示しています。