HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Lernen von Aufmerksamkeiten: Residuelle aufmerksamkeitsbasierte Siamesische Netzwerkarchitektur für hochleistungsfähiges Online-Visuelles Tracking

{Junliang Xing Zhu Teng Jin Gao Stephen Maybank Weiming Hu Qiang Wang}

Lernen von Aufmerksamkeiten: Residuelle aufmerksamkeitsbasierte Siamesische Netzwerkarchitektur für hochleistungsfähiges Online-Visuelles Tracking

Abstract

Die Offline-Training-Ansätze für Objektverfolgung haben in letzter Zeit großes Potenzial bei der Balance zwischen Verfolgungsgenauigkeit und Geschwindigkeit gezeigt. Dennoch ist es nach wie vor schwierig, ein offline trainiertes Modell effektiv online an ein zu verfolgendes Ziel anzupassen. In dieser Arbeit wird ein Residual Attentional Siamese Network (RASNet) für hochleistungsfähige Objektverfolgung vorgestellt. Das RASNet-Modell reformuliert den Korrelationsfilter innerhalb eines Siamese-Verfolkungsrahmens und integriert verschiedene Arten von Aufmerksamkeitsmechanismen, um das Modell anzupassen, ohne es online zu aktualisieren. Insbesondere nutzt das RASNet durch die Ausnutzung eines allgemeinen, offline trainierten Aufmerksamkeitsmechanismus, eines zieladaptiven Restaufmerksamkeitsansatzes sowie eines kanalpräferierten Merkmalsaufmerksamkeitsmechanismus nicht nur die Überanpassungsprobleme bei der tiefen Netzwerktrainierung zu mildern, sondern auch die Diskriminierungsfähigkeit und Anpassungsfähigkeit durch die Trennung von Repräsentationslernprozess und Diskriminierungslernprozess zu erhöhen. Die vorgeschlagene tiefe Architektur wird end-to-end trainiert und nutzt die reichhaltige räumlich-zeitliche Information vollständig, um eine robuste visuelle Verfolgung zu erreichen. Experimentelle Ergebnisse auf zwei aktuellen Benchmarks, OTB-2015 und VOT2017, zeigen, dass der RASNet-Tracker die derzeit beste Verfolgungsgenauigkeit erreicht und gleichzeitig mit einer Geschwindigkeit von mehr als 80 Bildern pro Sekunde läuft.

Benchmarks

BenchmarkMethodikMetriken
visual-object-tracking-on-otb-2013RASNet
AUC: 0.670

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Lernen von Aufmerksamkeiten: Residuelle aufmerksamkeitsbasierte Siamesische Netzwerkarchitektur für hochleistungsfähiges Online-Visuelles Tracking | Forschungsarbeiten | HyperAI