
要約
人物再識別(person re-identification)の成功には、多様な特徴を学習することが鍵となる。これまでに、局所的表現を学習するための多数の部分ベース(part-based)な手法が提案されてきたが、依然として最高性能を発揮する手法には及ばない。本論文では、オムニスケールネットワーク(OSNet)を基盤とし、部分レベルの特徴解像度(Part-Level feature Resolution)の概念に基づいて、強力かつ軽量なネットワークアーキテクチャ「PLR-OSNet」を提案する。提案手法は、グローバル特徴表現を担うブランチと、局所特徴表現を担うブランチの2本のブランチから構成される。局所ブランチは、部分レベルの特徴解像度を実現するための均一な分割戦略を採用しているが、既存の部分ベース手法とは異なり、単一の識別予測損失(identity-prediction loss)しか生成しない。実証的な結果から、PLR-OSNetはモデルサイズが小さくても、Market1501、DukeMTMC-reID、CUHK03といった代表的な人物再識別データセットにおいて、最先端の性能を達成することが示された。