HyperAIHyperAI
vor 7 Tagen

Effiziente Personen-Suche: Ein anchor-freier Ansatz

Yichao Yan, Jinpeng Li, Jie Qin, Shengcai Liao, Xiaokang Yang
Effiziente Personen-Suche: Ein anchor-freier Ansatz
Abstract

Personen-Suche zielt darauf ab, eine abfragende Person gleichzeitig in realistischen, ungeschnittenen Bildern zu lokalisieren und zu identifizieren. Um dieses Ziel zu erreichen, integrieren state-of-the-art-Modelle typischerweise einen Re-Identification (Re-ID)-Zweig in zweistufige Detektoren wie Faster R-CNN. Aufgrund der ROI-Align-Operation erzielt dieser Ansatz eine vielversprechende Genauigkeit, da Re-ID-Features explizit mit den entsprechenden Objektregionen ausgerichtet werden. Gleichzeitig führt er jedoch aufgrund der dichten Objekt-Anker zu hohem Rechenaufwand. In dieser Arbeit präsentieren wir einen anchor-free-Ansatz, um diese herausfordernde Aufgabe effizient zu bewältigen, durch die Einführung folgender spezialisierter Architekturen. Erstens wählen wir einen anchor-free-Detektor (nämlich FCOS) als Prototyp unserer Architektur. Aufgrund des Fehlens dichter Objekt-Anker weist er im Vergleich zu bestehenden Personen-Such-Modellen eine deutlich höhere Effizienz auf. Zweitens ergeben sich bei der direkten Anpassung dieses anchor-free-Detektors für die Personen-Suche mehrere gravierende Herausforderungen bei der Lernung robuster Re-ID-Features, die wir als Ausrichtungsprobleme auf unterschiedlichen Ebenen (d. h. Skala, Region und Aufgabe) zusammenfassen. Um diese Probleme zu lösen, schlagen wir ein ausgerichtetes Merkmalsaggregationsmodul vor, um differenziertere und robusteres Merkmals-Embedding zu generieren. Dementsprechend benennen wir unser Modell als Feature-Aligned Person Search Network (AlignPS). Drittens, indem wir die Vorzüge sowohl anchor-basierter als auch anchor-freier Modelle untersuchen, erweitern wir AlignPS um einen ROI-Align-Kopf, der die Robustheit der Re-ID-Features erheblich verbessert, während das Modell gleichzeitig äußerst effizient bleibt. Umfassende Experimente an zwei anspruchsvollen Benchmarks (nämlich CUHK-SYSU und PRW) zeigen, dass unser Framework state-of-the-art oder wettbewerbsfähige Leistung erzielt, gleichzeitig jedoch eine höhere Effizienz aufweist. Alle Quellcodes, Daten und trainierten Modelle sind verfügbar unter: https://github.com/daodaofr/alignps.

Effiziente Personen-Suche: Ein anchor-freier Ansatz | Neueste Forschungsarbeiten | HyperAI