Lernen der Entkoppelung von Szenen für die Person-Re-Identifikation

Bei der Aufgabe der Personen-Identifizierung (Person Re-Identification, ReID) gibt es zahlreiche herausfordernde Probleme, wie beispielsweise Verdeckung (Occlusion) und Skalenvariation. Bisherige Ansätze versuchen, diese Probleme meist durch den Einsatz eines einästigen Netzwerks zu bewältigen. Da dieses einästige Netzwerk gegen eine Vielzahl unterschiedlicher Herausforderungen robust sein muss, wird es übermäßig belastet. In dieser Arbeit wird ein Divide-and-Conquer-Ansatz für die ReID-Aufgabe vorgeschlagen. Dazu werden mehrere selbstüberwachte Operationen eingesetzt, um verschiedene Herausforderungen zu simulieren, wobei jedes Problem jeweils mit einem spezifischen Netzwerk bearbeitet wird. Konkret verwenden wir die Random Erasing-Operation und stellen eine neuartige Random Scaling-Operation vor, um Bilder mit kontrollierbaren Merkmalen zu generieren. Es wird ein allgemeines mehrästiges Netzwerk vorgestellt, das aus einem Master-Branch und zwei Servant-Branches besteht, um unterschiedliche Szenarien zu bewältigen. Diese Äste lernen kooperativ und erwerben unterschiedliche Wahrnehmungsfähigkeiten. Auf diese Weise werden komplexe Szenarien in der ReID-Aufgabe effektiv entkoppelt, und die Belastung jedes einzelnen Branches wird reduziert. Die Ergebnisse umfangreicher Experimente zeigen, dass die vorgeschlagene Methode state-of-the-art-Leistungen auf drei ReID-Benchmarks und zwei occluded ReID-Benchmarks erzielt. Eine Ablation-Studie belegt zudem, dass das vorgeschlagene Schema und die Operationen die Leistung in verschiedenen Szenarien signifikant verbessern. Der Quellcode ist unter https://git.openi.org.cn/zangxh/LDS.git verfügbar.