Tiefes Lernen von Prototyp-Domänen für die Wiedererkennung von Personen

Die Personen-Wiedererkennung (Re-ID) ist die Aufgabe, mehrere Auftreten derselben Person unter verschiedenen Bedingungen wie Kamerasicht, Körperhaltung, Beleuchtung und einer Vielzahl anderer Faktoren zu ordnen, die das visuelle Erscheinungsbild verändern. Üblicherweise wird dies durch das Lernen von optimalen Merkmalen oder Abstandsmaßen erreicht, die für spezifische Kameraansichten angepasst sind, wie sie durch paarweise beschriftete Trainingsdatensätze vorgegeben werden. In dieser Arbeit formulieren wir einen neuen Ansatz auf Basis des Deep Learnings zur automatischen Entdeckung von Prototypendomains für domänenbewusste (anpassbare) Personen-Wiedererkennung (statt des lernens spezifischer Kamerapaares), der auf beliebige Kameraansichten skalierbar ist und neue unbekannte Szenarien ohne Trainingsdaten abdeckt. Wir trainieren ein separates Re-ID-Modell für jede der entdeckten Prototypendomains und wählen während der Modellbereitstellung automatisch das Modell der am nächsten liegenden Prototypendomain basierend auf dem Probesbild der Person aus. Unser Ansatz erfordert weder überwachtes noch unüberwachtes Lernen zur Domänenanpassung, d.h., es sind keine Daten aus den Zieldomänen erforderlich. Wir evaluieren unser Modell umfassend unter realistischen Re-ID-Bedingungen mit automatisch erkannten Begrenzungsrahmen in niedriger Auflösung und teilweiser Verdeckung. Wir zeigen, dass unser Ansatz die meisten aktuellen überwachten und unüberwachten Methoden auf den neuesten CUHK-SYSU- und PRW-Benchmarks übertreffen kann.