HyperAIHyperAI
vor 11 Tagen

Siam R-CNN: Visuelle Verfolgung durch erneute Detektion

Paul Voigtlaender, Jonathon Luiten, Philip H.S. Torr, Bastian Leibe
Siam R-CNN: Visuelle Verfolgung durch erneute Detektion
Abstract

Wir präsentieren Siam R-CNN, eine Siamese-Redetection-Architektur, die das volle Potenzial zweistufiger Objektdetektionsansätze für die visuelle Objektverfolgung erschließt. Wir kombinieren dies mit einem neuartigen, auf Tracklets basierenden dynamischen Programmierungsansatz, der sowohl die erneute Detektion des Template-Objekts aus dem ersten Frame als auch die Vorhersagen aus vorherigen Frames nutzt, um die gesamte Verfolgungsgeschichte sowohl des zu verfolgenden Objekts als auch potenzieller Ablenkungsobjekte zu modellieren. Dadurch können unsere Entscheidungen bei der Verfolgung verbessert werden, und es wird ermöglicht, verfolgte Objekte auch nach langer Verdeckung erneut zu detektieren. Schließlich schlagen wir eine neuartige Strategie zur Auswahl harter Beispiele vor, um die Robustheit von Siam R-CNN gegenüber ähnlichen Objekten zu erhöhen. Siam R-CNN erreicht derzeit die besten Ergebnisse auf zehn unterschiedlichen Verfolgungsbenchmarks, insbesondere hervorragende Leistungen bei der Langzeitverfolgung. Den Quellcode und die Modelle stellen wir unter www.vision.rwth-aachen.de/page/siamrcnn zur Verfügung.

Siam R-CNN: Visuelle Verfolgung durch erneute Detektion | Neueste Forschungsarbeiten | HyperAI