HyperAIHyperAI

Command Palette

Search for a command to run...

Effiziente Personen-Suche: Ein anchor-freier Ansatz

Yichao Yan Jinpeng Li Jie Qin Shengcai Liao Xiaokang Yang

Zusammenfassung

Personen-Suche zielt darauf ab, eine abfragende Person gleichzeitig in realistischen, ungeschnittenen Bildern zu lokalisieren und zu identifizieren. Um dieses Ziel zu erreichen, integrieren state-of-the-art-Modelle typischerweise einen Re-Identification (Re-ID)-Zweig in zweistufige Detektoren wie Faster R-CNN. Aufgrund der ROI-Align-Operation erzielt dieser Ansatz eine vielversprechende Genauigkeit, da Re-ID-Features explizit mit den entsprechenden Objektregionen ausgerichtet werden. Gleichzeitig führt er jedoch aufgrund der dichten Objekt-Anker zu hohem Rechenaufwand. In dieser Arbeit präsentieren wir einen anchor-free-Ansatz, um diese herausfordernde Aufgabe effizient zu bewältigen, durch die Einführung folgender spezialisierter Architekturen. Erstens wählen wir einen anchor-free-Detektor (nämlich FCOS) als Prototyp unserer Architektur. Aufgrund des Fehlens dichter Objekt-Anker weist er im Vergleich zu bestehenden Personen-Such-Modellen eine deutlich höhere Effizienz auf. Zweitens ergeben sich bei der direkten Anpassung dieses anchor-free-Detektors für die Personen-Suche mehrere gravierende Herausforderungen bei der Lernung robuster Re-ID-Features, die wir als Ausrichtungsprobleme auf unterschiedlichen Ebenen (d. h. Skala, Region und Aufgabe) zusammenfassen. Um diese Probleme zu lösen, schlagen wir ein ausgerichtetes Merkmalsaggregationsmodul vor, um differenziertere und robusteres Merkmals-Embedding zu generieren. Dementsprechend benennen wir unser Modell als Feature-Aligned Person Search Network (AlignPS). Drittens, indem wir die Vorzüge sowohl anchor-basierter als auch anchor-freier Modelle untersuchen, erweitern wir AlignPS um einen ROI-Align-Kopf, der die Robustheit der Re-ID-Features erheblich verbessert, während das Modell gleichzeitig äußerst effizient bleibt. Umfassende Experimente an zwei anspruchsvollen Benchmarks (nämlich CUHK-SYSU und PRW) zeigen, dass unser Framework state-of-the-art oder wettbewerbsfähige Leistung erzielt, gleichzeitig jedoch eine höhere Effizienz aufweist. Alle Quellcodes, Daten und trainierten Modelle sind verfügbar unter: https://github.com/daodaofr/alignps.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp