Unüberwachte und selbstadaptierende Techniken für die cross-domain Person Re-Identification

Die Person-Re-Identifikation (ReID) über nicht überlappende Kameras stellt eine herausfordernde Aufgabe dar. Daher stützen sich die meisten Ansätze der vorherigen Forschung auf überwachtes Merkmalslernen aus einem annotierten Datensatz, um dieselbe Person aus verschiedenen Perspektiven zu identifizieren. Dies erfordert jedoch den zeitaufwändigen Prozess der Datenauswertung, was eine schnelle Implementierung – insbesondere in forensischen Szenarien – verhindert. Unüberwachte Domänenanpassung (Unsupervised Domain Adaptation, UDA) stellt hier eine vielversprechende Alternative dar, da sie eine Merkmalsanpassung von einem Quell- auf ein Zielgebiet ermöglicht, ohne dass Identitätslabels im Zielgebiet erforderlich sind. Allerdings beruhen die meisten UDA-basierten Algorithmen auf komplexen Verlustfunktionen mit mehreren Hyperparametern, was deren Verallgemeinerungsfähigkeit für unterschiedliche Szenarien beeinträchtigt. Zudem hängt UDA stark von der Übersetzung zwischen Domänen ab, weshalb es entscheidend ist, die zuverlässigsten Daten aus der bisher unbekannten Domäne auszuwählen, um eine Fehlpropagation durch verrauschte Beispiele im Zielgebiet zu vermeiden – ein Problem, das häufig übersehen wird. In diesem Sinne schlagen wir eine neuartige UDA-basierte ReID-Methode vor, die eine einfache Verlustfunktion mit lediglich einem Hyperparameter optimiert und dabei Tripletts von Beispielen nutzt, die durch eine neue offline-Strategie basierend auf der Vielfalt der Kameras innerhalb einer Cluster-Gruppe generiert werden. Diese Strategie passt nicht nur das Modell an, sondern regularisiert es auch und verhindert somit eine Überanpassung an das Zielgebiet. Zudem führen wir eine neue Selbst-Ensemble-Strategie ein, bei der Gewichte aus verschiedenen Iterationen aggregiert werden, um ein endgültiges Modell zu erstellen, das Wissen aus verschiedenen Phasen der Anpassung kombiniert. Zur Evaluation betrachten wir drei etablierte tiefen Lernarchitekturen und kombinieren sie für die abschließende Entscheidungsfindung. Die vorgeschlagene Methode verwendet weder eine Person-Re-Ranking-Technik noch irgendeine Annotation im Zielgebiet und erreicht auf den Adaptationsszenarien Market-to-Duke, Market1501-to-MSMT17 (eine anspruchsvolle Aufgabe) und Duke-to-MSMT17 sowohl eine bessere Leistung als auch eine deutlich einfachere Einstellung im Vergleich zum aktuellen Stand der Technik.