Command Palette
Search for a command to run...
{Dongxiao Yu Xiaowei Yu Zengrui Zhao Yanwei Zheng}
要約
人物再識別(ReID)は、顔が利用できない状況下で1人以上の人間を識別または検証するという、挑戦的なコンピュータビジョンの課題である。ReIDにおいて、識別が困難な背景が前景の認識に悪影響を及ぼすことが多く、その結果、モデルの性能が低下する。一般的に、同一カメラからの背景は類似しているが、異なるカメラ間の背景は著しく異なる。この知見に基づき、我々はトランスフォーマー構造に学習可能なテンプレートを導入することで、サンプル間で識別が困難な特徴を学習する「テンプレート意識型トランスフォーマー(TAT)」手法を提案する。この手法により、背景や遮蔽領域など識別性が低い画像領域へのモデルの注目度を低減できる。エンコーダのマルチヘッドアテンションモジュールにおいて、このテンプレートは画像内の識別が困難な特徴に注目する「テンプレート意識アテンション」を制御し、エンコーダブロックが深くなるに従って、識別性の高い特徴への注目度を段階的に増強する。また、ReIDタスクの特性を考慮して補助情報を利用し、テンプレート数を増加させることで、カメラIDによって大きく変化する背景に対してもモデルの適応性を高めている。最後に、多数の公的データセットを用いた実験により、本手法の有効性を検証し、定量的評価を通じて競争力のある結果を達成した。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| person-re-identification-on-dukemtmc-reid | TAT | Rank-1: 91.5 mAP: 82.5 |
| person-re-identification-on-market-1501 | TAT | Rank-1: 95.8 mAP: 89.7 |
| person-re-identification-on-occluded-dukemtmc | TAT | Rank-1: 68.2 mAP: 60.6 |