Feature Erasing und Diffusionsnetzwerk für die Wiedererkennung von Personen mit verdeckten Bereichen

Die Wiedererkennung von Personen bei Verdeckung (ReID) zielt darauf ab, verdeckte Personenbilder mit vollständigen Bildern über verschiedene Kameraperspektiven zu vergleichen. Ziel-Pedestrian (TP) werden in der Regel durch Nicht-Pedestrian-Verdeckungen (NPO) und Nicht-Ziel-Pedestrian (NTP) gestört. Vorherige Methoden konzentrierten sich hauptsächlich darauf, die Robustheit des Modells gegen NPO zu erhöhen, während sie die Kontamination von Merkmalen durch NTP vernachlässigten. In dieser Arbeit schlagen wir ein neues Feature-Erasing-und-Diffusionsnetzwerk (FED) vor, das gleichzeitig NPO und NTP behandelt. Insbesondere werden NPO-Merkmale durch unser vorgeschlagenes Verdeckungs-Erasure-Modul (OEM) eliminiert, unterstützt von einer NPO-Augmentierungsstrategie, die NPO auf vollständigen Pedestrian-Bildern simuliert und präzise Verdeckungsmasken generiert. Anschließend diffundieren wir die Pedestrian-Darstellungen mit anderen gespeicherten Merkmalen, um in der Merkmalsraum NTP-Kennzeichen zu synthetisieren. Dies wird durch ein neuartiges Feature-Diffusionsmodul (FDM) erreicht, das einen lernfähigen Cross-Attention-Mechanismus verwendet. Unter der Leitung der Verdeckungswerte vom OEM findet der Diffusionsprozess der Merkmale hauptsächlich auf sichtbaren Körperpartien statt, was die Qualität der synthetisierten NTP-Kennzeichen gewährleistet. Durch die gemeinsame Optimierung von OEM und FDM in unserem vorgeschlagenen FED-Netzwerk können wir die Wahrnehmungsfähigkeit des Modells gegenüber TP erheblich verbessern und den Einfluss von NPO und NTP mildern. Darüber hinaus dient das vorgeschlagene FDM nur als Hilfsmodul für das Training und wird in der Inferenzphase verworfen, wodurch kaum zusätzliche Berechnungsaufwand entsteht. Experimente an Benchmarks für verdeckte und vollständige Person-ReID zeigen die Überlegenheit von FED im Vergleich zu den aktuellen Stand der Technik, wobei FED eine Rang-1-Akkuratesse von 86,3 % auf Occluded-REID erreicht, was mindestens 4,7 % höher ist als bei anderen Methoden.请注意,这里的“法语”应该是“德语”,因此我按照德语的要求进行了翻译。