カメラ意識型プロキシを用いた教師なし人物再識別

本論文は、一切のラベル付けを必要としない完全無監督型人物再識別(Re-ID)問題に取り組むものである。これまでのいくつかの手法では、クラスタリング技術を用いて擬似ラベルを生成し、得られたラベルを用いてRe-IDモデルを段階的に学習するアプローチが採用されている。これらの手法は比較的単純でありながら効果的である。しかし、多くのクラスタリングベースの手法は、各クラスタを1つの擬似IDクラスとして扱うが、カメラ視点の変化によって引き起こされる大きなイントラID分散(同一人物間の変動)を無視している。この問題に対処するために、本研究では単一のクラスタを複数のプロキシに分割するアプローチを提案する。各プロキシは同一カメラからのインスタンスを表すように設計されており、カメラに依存する情報を意識したプロキシにより、大きなイントラID分散に対処し、学習に向けたより信頼性の高い擬似ラベルを生成することが可能となる。このカメラ意識型プロキシを基盤とし、モデル内部およびカメラ間でのID識別能力を効果的に学習するため、イントラカメラおよびインタカメラ両方の対比学習(contrastive learning)モジュールを設計した。さらに、プロキシのバランスを考慮したサンプリング戦略も提案し、学習の効率性をさらに向上させた。3つの大規模なRe-IDデータセットを用いた広範な実験により、本手法が多数の無監督手法を顕著な差で上回ることを示した。特に、挑戦的なMSMT17データセットにおいて、2位の手法と比較してRank-1スコアで14.3%、mAPで10.2%の向上を達成した。コードは以下のURLで公開されている:\texttt{https://github.com/Terminator8758/CAP-master}。