Raum-Zeitliche Person Re-Identifizierung

Die meisten aktuellen Methoden der Personenerkennung (ReID) vernachlässigen eine räumlich-zeitliche Einschränkung. Bei einem Abfragebild berechnen herkömmliche Methoden die Merkmalsdistanzen zwischen dem Abfragebild und allen Galeriebildern und geben eine nach Ähnlichkeit sortierte Tabelle zurück. In der Praxis, wenn die Galeriedatenbank sehr groß ist, schlagen diese Ansätze aufgrund der Erscheinungsambiguität bei verschiedenen Kameraperspektiven fehl. In diesem Artikel stellen wir einen neuen zweistrom-räumlich-zeitlichen Rahmen zur Personenerkennung (st-ReID) vor, der sowohl visuelle semantische Informationen als auch räumlich-zeitliche Informationen auswertet. Zu diesem Zweck wird ein gemeinsames Ähnlichkeitsmaß mit Logistischer Glättung (LS) eingeführt, um zwei Arten von heterogenen Informationen in einen einheitlichen Rahmen zu integrieren. Um eine komplexe räumlich-zeitliche Wahrscheinlichkeitsverteilung anzunähern, entwickeln wir eine schnelle Histogramm-Parzen-Methode (HP). Mit Hilfe der räumlich-zeitlichen Einschränkung eliminiert das st-ReID-Modell viele nicht relevante Bilder und verkleinert somit die Galeriedatenbank. Ohne zusätzliche Verfeinerungen erreicht unsere st-ReID-Methode eine Rang-1-Akkuratesse von 98,1 % auf Market-1501 und 94,4 % auf DukeMTMC-reID, was jeweils eine Verbesserung gegenüber den Baselines von 91,2 % und 83,8 % darstellt und alle bisherigen Stand-von-die-Kunst-Methoden deutlich übertrifft.