Re-identification Spatio-temporelle de Personnes

La plupart des méthodes actuelles de réidentification de personnes (ReID) négligent une contrainte spatio-temporelle. Étant donné une image de requête, les méthodes conventionnelles calculent les distances de caractéristiques entre l'image de requête et toutes les images de la galerie, puis retournent un tableau classé par similarité. Lorsque la base de données de la galerie est très importante en pratique, ces approches échouent à obtenir de bonnes performances en raison d'ambiguïtés d'apparence entre différentes vues caméra. Dans cet article, nous proposons un nouveau cadre de réidentification de personnes à deux flux spatio-temporel (st-ReID) qui exploite à la fois les informations sémantiques visuelles et les informations spatio-temporelles. À cette fin, une métrique de similarité conjointe avec le Lissage Logistique (LS) est introduite pour intégrer deux types d'informations hétérogènes dans un cadre unifié. Pour approximer une distribution de probabilité spatio-temporelle complexe, nous avons développé une méthode rapide d'Histogramme-Parzen (HP). Grâce à la contrainte spatio-temporelle, le modèle st-ReID élimine beaucoup d'images non pertinentes et réduit ainsi considérablement la base de données de la galerie. Sans recourir à des techniques supplémentaires complexes, notre méthode st-ReID atteint une précision au rang 1 de 98,1 % sur Market-1501 et 94,4 % sur DukeMTMC-reID, améliorant respectivement les baselines à 91,2 % et 83,8 %, surpassant largement toutes les méthodes précédentes d'état de l'art.