
要約
既存の人物再識別(re-id)手法の多くは、各カメラペアごとに手動でラベリングされたペアワイズ訓練データを用いた監督モデル学習に依存しています。これにより、実際の再識別展開において、各カメラペアに対して画像の正例と負例のペアを完全にラベリングすることができないため、スケーラビリティが低下します。本研究では、この問題に対処するために、ビデオから自動生成された人物トラックレットデータから潜在的な再識別判別情報を段階的に発見し利用できる非監督再識別深層学習手法を提案します。これはエンドツーエンドのモデル最適化を可能にするものです。我々は、トラックレット関連付け非監督深層学習(Tracklet Association Unsupervised Deep Learning: TAUDL)フレームワークを定式化しました。このフレームワークは、各カメラ内の(カメラ内)トラックレット関連付け(ラベリング)と、カメラ間のトラックレット相関を最大限に発見することによって共同で学習する特徴を持っています。広範な実験結果は、6つの人物再識別ベンチマークデータセットを使用して、提案されたTAUDLモデルが最先端の非監督およびドメイン適応再識別手法よりも優れていることを示しています。