Zur Verteidigung des Triplet-Loss für die Person-Wiedererkennung

In den letzten Jahren hat das Gebiet der Computer Vision eine Revolution durchgemacht, die hauptsächlich durch die Verfügbarkeit großer Datensätze und die Einführung tiefer Faltungsnetze für das End-to-End-Lernen getrieben wurde. Auch das Teilgebiet der Person Re-Identification ist davon nicht ausgenommen. Leider scheint in der Gemeinschaft der weit verbreitete Glaube zu herrschen, dass der Triplet Loss unterlegen ist im Vergleich zur Verwendung von Surrogate Losses (Klassifikation, Verifizierung) gefolgt von einem separaten Schritt des Metrik-Lernens. Wir zeigen, dass sowohl für Modelle, die von Grund auf trainiert wurden, als auch für vortrainierte Modelle, die Verwendung einer Variante des Triplet Losses zum Durchführen des End-to-End-Tiefen Metrik-Lernens die meisten anderen veröffentlichten Methoden um ein großes Maß übertrifft.