Tracking-by-Trackers mit einem verfeinerten und verstärkten Modell

Die visuelle Objektverfolgung wurde traditionell durch die unabhängige Betrachtung schneller Verarbeitungsalgorithmen, genauer Online-Anpassungsmethoden sowie der Fusion mehrerer Verfolger angegangen. In diesem Artikel vereinheitlichen wir diese Ziele durch die Einführung einer neuen Verfolgungsmethode, die die Stärken anderer visueller Verfolger – sowohl offline als auch online – nutzt. Ein kompakter Studentenmodell wird durch die Kombination von Wissensdistillation und Verstärkendem Lernen trainiert. Die Wissensdistillation ermöglicht die Übertragung und Kompression von Verfolkungs-Wissen aus anderen Verfolgern, während das Verstärkende Lernen das Lernen von Bewertungsmaßen erlaubt, die anschließend online genutzt werden. Nach dem Training kann der Student letztendlich zur Entwicklung (i) eines sehr schnellen Ein-Schuss-Verfolgers, (ii) eines Verfolgers mit einer einfachen und effektiven Online-Anpassungsmethode sowie (iii) eines Verfolgers, der andere Verfolger fusioniert, eingesetzt werden. Umfassende Validierungen zeigen, dass die vorgeschlagenen Algorithmen mit Echtzeit-Stand der Technik konkurrieren.