17日前

人物再識別のための深層ピラミダル表現の集約

{Christian Micheloni, Niki Martinel, Gian Luca Foresti}
人物再識別のための深層ピラミダル表現の集約
要約

人物再識別(Re-ID)において、意味的レベルの異なる多様な視点不変性およびマルチスケールな人物外見表現を学習することは極めて重要である。近年、コミュニティは深層Re-IDモデルの開発に多大な努力を注ぎ、全体的な単一意味レベルの特徴表現を捉えることを目的としている。性能のさらなる向上を目指して、追加の視覚的属性やボディパーツ駆動型モデルの導入が検討されてきた。しかしながら、これらは膨大な人手によるラベル付け作業を要するか、あるいは追加の計算負荷を伴うという課題を抱えている。本研究では、マルチスケール情報を捉えるピラミッド構造を模した手法が、こうした制約を克服できる可能性があると主張する。具体的には、人物の視覚的情報を表現するマルチスケールのストライプを、新たなアーキテクチャによって複数の意味レベルにおける潜在的で判別性の高い要因に分解する。さらに、マルチタスク損失とカリキュラム学習戦略を組み合わせることで、判別性と不変性を兼ね備えた人物表現を学習し、三重組類似度学習に活用する。3つのベンチマークRe-IDデータセットにおける実験結果から、従来手法を上回る性能が達成された(例:Duke-MTMCデータセットにおいて90%以上の精度)。