Anpassungs- und Wiedererkennungsnetzwerk: Ein unüberwachter tiefes Transfer-Lernansatz für die Wiedererkennung von Personen

Die Person-Wiedererkennung (Re-ID) hat das Ziel, dieselbe Person auf Bildern zu erkennen, die von verschiedenen Kameras aufgenommen wurden. Um diese Aufgabe zu bewältigen, wird in der Regel eine große Menge an beschrifteten Daten benötigt, um ein effektives Re-ID-Modell zu trainieren, was für praktische Anwendungen in der Realwelt möglicherweise nicht realisierbar ist. Um diese Einschränkung zu mildern, nutzen wir eine ausreichende Menge an bereits vorhandenen beschrifteten Daten aus einem anderen (nebenläufigen) Datensatz. Durch die gemeinsame Berücksichtigung dieses nebenläufigen Datensatzes und des interessierenden Datensatzes (ohne Beschriftungsinformationen) führt unser vorgeschlagenes Anpassungs- und Wiedererkennungsnetzwerk (ARN) unüberwachtes Domänenanpassung durch. Dies nutzt Informationen über verschiedene Datensätze und leitet domäneninvariante Merkmale für Re-ID-Zwecke ab. In unseren Experimenten verifizieren wir, dass unser Netzwerk sich gegenüber den neuesten unüberwachten Re-ID-Ansätzen günstig auswirkt und sogar eine Reihe von Baseline-Re-ID-Methoden übertreffen kann, die vollständig überwachte Daten zum Training benötigen.