HyperAIHyperAI
vor 17 Tagen

GradNet: Gradient-gesteuertes Netzwerk für visuelle Objektverfolgung

Peixia Li, Boyu Chen, Wanli Ouyang, Dong Wang, Xiaoyun Yang, Huchuan Lu
GradNet: Gradient-gesteuertes Netzwerk für visuelle Objektverfolgung
Abstract

Das vollständig konvolutionale Siamese-Netzwerk auf Basis der Template-Matching-Technik hat großes Potenzial im Bereich des visuellen Verfolgungssystems gezeigt. Während der Testphase bleibt das Template mit den Merkmalen des initialen Ziels fixiert, wobei die Leistungsfähigkeit vollständig von der allgemeinen Übereinstimmungsfähigkeit des Siamese-Netzwerks abhängt. Dieser Ansatz kann jedoch zeitliche Veränderungen des Ziels oder Hintergrundstörungen nicht adäquat erfassen. In dieser Arbeit stellen wir ein neuartiges, gradientenbasiertes Netzwerk vor, das diskriminative Informationen in Gradienten ausnutzt und das Template im Siamese-Netzwerk durch Vorwärts- und Rückwärtsoperationen aktualisiert. Unser Algorithmus führt sowohl Vorwärts- als auch Rückwärtsoperationen durch, um diskriminative Informationen in den Gradienten zu erschließen und die zentrale Aufmerksamkeit auf das Ziel zu fokussieren. Genauer gesagt kann der Algorithmus Informationen aus den Gradienten nutzen, um das Template im aktuellen Frame zu aktualisieren. Zudem wird eine Methode zur allgemeinen Trainingsstrategie des Templates vorgeschlagen, um Gradienteninformationen effizienter zu nutzen und Überanpassung zu vermeiden. Nach unserem Wissen stellt diese Arbeit den ersten Versuch dar, Informationen aus Gradienten zur Aktualisierung des Templates in Siamese-basierten Verfolgungssystemen zu nutzen. Umfangreiche Experimente auf aktuellen Benchmark-Datenbanken zeigen, dass unsere Methode eine bessere Leistung als andere state-of-the-art-Verfolgungssysteme erzielt.