
要約
人物再識別(Re-ID)タスクにおける識別性能の向上には、全局特徴と部分特徴の組み合わせが重要な解決策となっています。従来の部分に基づく手法は、主に特定の事前定義された意味を持つ領域を特定し、局所表現を学習することに焦点を当てており、学習の難易度が高くなるだけでなく、大きな変動があるシナリオでは効率的でも堅牢でもありません。本論文では、様々な粒度の識別情報を統合するエンドツーエンドの特徴学習戦略を提案します。私たちは慎重に設計し、多粒度ネットワーク(Multiple Granularity Network: MGN)というマルチブランチ深層ネットワークアーキテクチャを開発しました。このアーキテクチャは、全局特徴表現用の1つのブランチと局所特徴表現用の2つのブランチで構成されています。意味的な領域での学習ではなく、画像を均一に複数の帯状領域に分割し、異なる局所ブランチで部分数を変えることで、複数粒度の局所特徴表現を得ています。主要な評価データセットであるMarket-1501、DukeMTMC-reIDおよびCUHK03で実施した包括的な実験結果は、私たちの方法が堅牢に最先端の性能を達成しており、既存の手法よりも大幅に優れていることを示しています。例えば、Market-1501データセットにおいて単一クエリモードで再ランキング後、Rank-1/mAP=96.6%/94.2%という最先端の結果を得ています。