HIPTrack: Visuelle Verfolgung mit historischen Prompting

Tracker, die dem Siamese-Paradigma folgen, nutzen die Ähnlichkeitsanpassung zwischen Vorlagen- und Suchbereichsmerkmalen zur Verfolgung. Zahlreiche Ansätze wurden untersucht, um die Tracking-Leistung durch Einbeziehung der Verfolgungsgeschichte zu verbessern, insbesondere zur Bewältigung von Ziel-Erscheinungsveränderungen wie Deformation und Verdeckung. Allerdings ist die Nutzung historischer Informationen in bestehenden Methoden unzureichend und unvollständig, was typischerweise wiederholtes Training und einen erheblichen Rechenaufwand erfordert. In diesem Artikel zeigen wir, dass durch die Bereitstellung eines Siamese-Paradigma folgenden Trackers mit präzisen und aktuell aktualisierten historischen Informationen eine erhebliche Leistungssteigerung erzielt werden kann, ohne dass die Modellparameter verändert werden müssen. Ausgehend davon schlagen wir ein historisches Prompt-Netzwerk vor, das verfeinerte historische Vordergrundmasken sowie historische visuelle Merkmale des Ziels nutzt, um dem Tracker umfassende und präzise Anregungen bereitzustellen. Wir entwickeln einen neuen Tracker namens HIPTrack auf Basis des historischen Prompt-Netzwerks, der erhebliche Leistungsverbesserungen erzielt, ohne dass das gesamte Modell neu trainiert werden muss. Wir führen Experimente auf sieben Datensätzen durch, und die Ergebnisse zeigen, dass unsere Methode die derzeitigen State-of-the-Art-Tracker auf LaSOT, LaSOText, GOT-10k und NfS übertrifft. Darüber hinaus lässt sich das historische Prompt-Netzwerk nahtlos als Plug-and-Play-Modul in bestehende Tracker integrieren und liefert eine Leistungssteigerung. Der Quellcode ist unter https://github.com/WenRuiCai/HIPTrack verfügbar.