Lernen vielfältiger Merkmale mit teilweiser Auflösung für die Personenwiedererkennung

Das Lernen diverser Merkmale ist entscheidend für den Erfolg der Personen-Identifikation (person re-identification). Verschiedene teilspezifische Methoden wurden umfassend vorgeschlagen, um lokale Darstellungen zu lernen, die jedoch weiterhin hinter den leistungsstärksten Methoden zur Personen-Identifikation zurückbleiben. In dieser Arbeit wird ein starkes, leichtgewichtiges Netzwerkarchitekturkonzept vorgestellt, das als PLR-OSNet bezeichnet wird und auf der Idee der Part-Level Feature Resolution über dem Omni-Scale Network (OSNet) basiert, um Merkmalsvielfalt zu erreichen. Das vorgeschlagene PLR-OSNet verfügt über zwei Zweige: einen Zweig zur globalen Merkmalsdarstellung und einen anderen zur lokalen Merkmalsdarstellung. Der lokale Zweig nutzt eine gleichmäßige Partitionierungsstrategie zur teilspezifischen Merkmalsauflösung, erzeugt jedoch nur eine einzige Identitätsvorhersage-Verlustfunktion – im starken Gegensatz zu bestehenden teilspezifischen Ansätzen. Empirische Ergebnisse zeigen, dass das vorgeschlagene PLR-OSNet trotz seiner geringen Modellgröße state-of-the-art-Leistung auf gängigen Personen-Identifikations-Datensätzen wie Market1501, DukeMTMC-reID und CUHK03 erzielt.