
要約
高精度の人物再識別(Re-ID)には、歩行者の全体的な輪郭と局所的な詳細の両方への注目が求められる。より代表的な特徴を抽出するための有効な手法として、複数のブランチを持つ深層モデルの活用が挙げられる。しかし、多数の既存手法では、部分的なバックボーン構造を複製する方式を採用しているため、計算コストが著しく増加する傾向にある。本論文では、ネットワークの異なる層から特徴を抽出し、双方向ピラミッド構造で統合する軽量な特徴ピラミッドブランチ(Feature Pyramid Branch: FPB)を提案する。アテンションモジュールと本研究で提案する「クロス直交正則化(cross orthogonality regularization)」を組み合わせることで、1.5M未満の追加パラメータのみを導入したにもかかわらず、バックボーンネットワークの性能を顕著に向上させた。標準ベンチマークデータセットにおける広範な実験結果から、本研究で提案するFPBを用いたモデルは、最先端の手法を明確に上回る性能を発揮するとともに、モデルの複雑さは大幅に低減されていることが示された。FPBは、現在広く用いられている物体検出手法における特徴ピラミッドネットワーク(Feature Pyramid Network: FPN)のアイデアを借用している。筆者らの知る限り、本研究は、このようなピラミッド構造を人物再識別タスクに成功裏に適用した初の試みであり、実証的にピラミッドネットワークを付属ブランチとして用いることが、関連する特徴埋め込みモデルにおいて有望な構造であることを示している。ソースコードは、https://github.com/anocodetest1/FPB.git にて公開されている。