FEAR: Schnell, effizient, genau und robustes visuelles Verfolgungssystem

Wir stellen FEAR vor, eine Familie schneller, effizienter, genauer und robuster Siamese-Visual-Tracker. Wir präsentieren eine neuartige und effiziente Methode zur Nutzung einer Dual-Template-Darstellung für die Anpassung des Objektmodells, die zeitliche Information mit lediglich einem lernbaren Parameter integriert. Zudem verbessern wir die Tracker-Architektur durch einen pixelweisen Fusion-Block. Durch die Integration leistungsfähiger Backbone-Netzwerke mit den oben genannten Modulen übertrifft der FEAR-M- und FEAR-L-Tracker auf mehreren akademischen Benchmarks die meisten bestehenden Siamese-Tracker sowohl hinsichtlich Genauigkeit als auch Effizienz. Mit einem leichtgewichtigen Backbone bietet die optimierte Variante FEAR-XS eine mehr als zehnfach schnellere Verfolgung im Vergleich zu aktuellen Siamese-Trackern, während nahezu state-of-the-art-Ergebnisse beibehalten werden. Der FEAR-XS-Tracker ist 2,4-mal kleiner und 4,3-mal schneller als LightTrack, wobei die Genauigkeit überlegen ist. Zusätzlich erweitern wir die Definition der Modell-Effizienz durch die Einführung des FEAR-Benchmarks, der Energieverbrauch und Ausführungs-Geschwindigkeit bewertet. Wir zeigen, dass der Energieverbrauch ein entscheidender Faktor für Tracker auf mobilen Geräten darstellt. Der Quellcode, vortrainierte Modelle und das Evaluationsprotokoll sind unter https://github.com/PinataFarms/FEARTracker verfügbar.