HyperAIHyperAI
vor 15 Tagen

Mehraufgaben-Lernens mit groben Priorisierungen für robuste, teilbewusste Personenwiedererkennung

Changxing Ding, Kan Wang, Pengfei Wang, Dacheng Tao
Mehraufgaben-Lernens mit groben Priorisierungen für robuste, teilbewusste Personenwiedererkennung
Abstract

Part-level Darstellungen sind für eine robuste Personen-Identifikation (Person Re-Identification, ReID) von großer Bedeutung, doch in der Praxis leidet die Merkmalsqualität aufgrund des Problems der Körperparten-Verzerrung. In diesem Artikel präsentieren wir eine robuste, kompakte und einfach zu verwendende Methode namens Multi-task Part-aware Network (MPN), die darauf ausgelegt ist, semantisch ausgerichtete Part-level-Merkmale aus Fußgängerbildern zu extrahieren. MPN löst das Problem der Körperparten-Verzerrung durch Multi-Task-Lernen (MTL) im Trainingsstadium. Genauer gesagt, baut sie für jede Körperparte auf demselben Backbone-Modell eine Hauptaufgabe (Main Task, MT) und eine Hilfsaufgabe (Auxiliary Task, AT) auf. Die ATs verfügen über eine grobe Vorinformation zu den Positionen der Körperparten für die Trainingsbilder. Diese ATs übertragen anschließend das Konzept der Körperparten auf die MTs, indem sie die Parameter der MTs optimieren, um partenrelevante Kanäle aus dem Backbone-Modell zu identifizieren. Diese Konzeptübertragung wird durch zwei neuartige Ausrichtungsstrategien erreicht: nämlich Parameter-Raum-Ausrichtung mittels harter Parameter-Teilung und Merkmalsraum-Ausrichtung klassenweise. Mit Hilfe der gelernten hochwertigen Parameter können die MTs im Teststadium unabhängig semantisch ausgerichtete Part-level-Merkmale aus den relevanten Kanälen extrahieren. MPN weist drei entscheidende Vorteile auf: 1) Es ist nicht notwendig, im Inference-Stadium eine Körperparten-Detektion durchzuführen; 2) Das Modell ist äußerst kompakt und effizient sowohl im Training als auch im Test; 3) Im Trainingsstadium benötigt es lediglich grobe Vorinformationen zu den Körperpartenpositionen, die leicht erhältlich sind. Systematische Experimente an vier großen ReID-Datenbanken zeigen, dass MPN stets deutlich über den Stand der Technik hinausgeht. Der Quellcode ist unter https://github.com/WangKan0128/MPN verfügbar.

Mehraufgaben-Lernens mit groben Priorisierungen für robuste, teilbewusste Personenwiedererkennung | Neueste Forschungsarbeiten | HyperAI