HyperAIHyperAI
vor 2 Monaten

Verbesserte Personenerkennung basierend auf Salienz und semantischer Analyse mit tiefen Neuronalen Netzwerken

Rodolfo Quispe; Helio Pedrini
Verbesserte Personenerkennung basierend auf Salienz und semantischer Analyse mit tiefen Neuronalen Netzwerken
Abstract

Gegeben sei ein Video oder ein Bild einer Person, das von einer Kamera aufgenommen wurde. Die Person-Wiedererkennung (Person Re-Identification) ist der Prozess, alle Instanzen derselben Person aus Videos oder Bildern zu retrivieren, die von einer anderen Kamera mit nicht überlappenden Blickwinkeln aufgenommen wurden. Diese Aufgabe findet Anwendung in verschiedenen Bereichen wie Überwachung, Forensik, Robotik und Multimedia. In dieser Arbeit stellen wir einen neuen Rahmen vor, den Saliency-Semantic Parsing Wiedererkennungsrahmen (SSP-ReID), der es ermöglicht, die Fähigkeiten beider Hinweise – Salienz und semantische Segmentierungskarten – zu nutzen, um ein grundlegendes konvolutions neuronales Netzwerk (CNN) zu leiten. Dies führt dazu, dass das Netzwerk ergänzende Darstellungen lernt, die die Ergebnisse im Vergleich zu den ursprünglichen Grundlagen verbessern. Die Erkenntnis aus der Fusion mehrerer Hinweise basiert auf spezifischen Szenarien, in denen eine Antwort besser ist als eine andere, wodurch ihre Kombination zur Leistungssteigerung begünstigt wird. Aufgrund seiner Definition kann unser Rahmen leicht auf eine Vielzahl von Netzen angewendet werden und im Gegensatz zu anderen wettbewerbsfähigen Methoden folgt unser Trainingsprozess einfachen und standardisierten Protokollen. Wir präsentieren eine umfangreiche Evaluation unseres Ansatzes durch fünf Grundlagen und drei Benchmarks. Experimentelle Ergebnisse zeigen die Effektivität unseres Person-Wiedererkennungsrahmens. Zudem kombinieren wir unseren Rahmen mit Re-Ranking-Techniken, um state-of-the-art-Ergebnisse bei drei Benchmarks zu erzielen.请注意,"state-of-the-art" 在德语中通常保留为英语术语,特别是在科技文献中。如果您希望将其完全翻译为德语,可以使用 "stand der technik"。