MSINet: Zwillingskontrastsuche für mehrskalige Interaktion in der Objekt-ReID

Die Neural Architecture Search (NAS) hat in der Gesellschaft für Objekt-Re-Identifikation (ReID) zunehmend an Attraktivität gewonnen, da task-spezifische Architekturen die Retrieval-Leistung erheblich verbessern. Frühere Arbeiten untersuchten neue Optimierungsziele und Suchräume für NAS ReID, vernachlässigten aber den Unterschied zwischen den Trainingsmethoden für Bildklassifizierung und ReID. In dieser Arbeit schlagen wir einen neuen Twins Contrastive Mechanismus (TCM) vor, um eine angemessenere Überwachung für die Architekturssuche bei ReID zu bieten. Der TCM verringert die Kategorieüberlappungen zwischen den Trainings- und Validierungsdaten und unterstützt die NAS dabei, realistische ReID-Trainingsmethoden nachzubilden. Anschließend entwerfen wir einen Multi-Skalen-Interaktionssuchraum (MSI), um rationale Interaktionsoperationen zwischen mehrskaligen Merkmalen zu suchen. Darüber hinaus führen wir ein räumliches Ausrichtungsmodul (Spatial Alignment Module, SAM) ein, um die Aufmerksamkeitskonsistenz bei Bildern aus verschiedenen Quellen weiter zu verbessern. Unter dem vorgeschlagenen NAS-Schema wird eine spezifische Architektur automatisch gesucht und als MSINet bezeichnet. Umfangreiche Experimente zeigen, dass unsere Methode sowohl in in-domänen als auch in cross-domänen Szenarien den Stand der Technik bei ReID-Methoden übertrifft. Die Quellcode ist unter https://github.com/vimar-gu/MSINet verfügbar.