ABD-Net: Aufmerksam und Vielfältig zur Personenerkennung

Die Aufmerksamkeitsmechanismen (Attention Mechanisms) haben sich als effektiv für die Person-Wiedererkennung (Person Re-Identification, Re-ID) erwiesen. Allerdings können die gelernten aufmerksamkeitsbasierten Merkmalsrepräsentationen (attentive feature embeddings), die oft nicht natürlich vielfältig oder unkorreliert sind, die Suchleistung basierend auf dem Euklidischen Abstand beeinträchtigen. Wir plädieren dafür, dass Vielfalt erzwungen werden sollte, um die Leistungsfähigkeit der Aufmerksamkeit stark zu ergänzen. Zu diesem Zweck schlagen wir ein Aufmerksamkeits- und Vielfalt-netzwerk (Attentive but Diverse Network, ABD-Net) vor, das Aufmerksamkeitsmodule und Vielfaltregularisierung nahtlos über das gesamte Netzwerk integriert, um repräsentative, robuste und diskriminativere Merkmale zu lernen. Insbesondere führen wir ein Paar komplementärer Aufmerksamkeitsmodule ein, die sich jeweils auf Kanalaggregation und Positionsbewusstsein konzentrieren. Darüber hinaus wird eine neue effiziente Form der Orthogonalitätsbedingung abgeleitet, um Orthogonalität sowohl auf den verborgenen Aktivierungen als auch auf den Gewichten durchzusetzen. Durch sorgfältige Ausblendungsstudien (Ablation Studies) verifizieren wir, dass sowohl die vorgeschlagenen aufmerksamkeitsbezogenen als auch die vielfaltbezogenen Terme jeweils zur Leistungssteigerung von ABD-Net beitragen. In drei weit verbreiteten Benchmarks übertreffen ABD-Net konsistent bestehende Methoden der aktuellen Forschung (state-of-the-art methods).