Siam R-CNN: Visuelle Verfolgung durch erneute Detektion

Wir präsentieren Siam R-CNN, eine Siamese-Redetection-Architektur, die das volle Potenzial zweistufiger Objektdetektionsansätze für die visuelle Objektverfolgung erschließt. Wir kombinieren dies mit einem neuartigen, auf Tracklets basierenden dynamischen Programmierungsansatz, der sowohl die erneute Detektion des Template-Objekts aus dem ersten Frame als auch die Vorhersagen aus vorherigen Frames nutzt, um die gesamte Verfolgungsgeschichte sowohl des zu verfolgenden Objekts als auch potenzieller Ablenkungsobjekte zu modellieren. Dadurch können unsere Entscheidungen bei der Verfolgung verbessert werden, und es wird ermöglicht, verfolgte Objekte auch nach langer Verdeckung erneut zu detektieren. Schließlich schlagen wir eine neuartige Strategie zur Auswahl harter Beispiele vor, um die Robustheit von Siam R-CNN gegenüber ähnlichen Objekten zu erhöhen. Siam R-CNN erreicht derzeit die besten Ergebnisse auf zehn unterschiedlichen Verfolgungsbenchmarks, insbesondere hervorragende Leistungen bei der Langzeitverfolgung. Den Quellcode und die Modelle stellen wir unter www.vision.rwth-aachen.de/page/siamrcnn zur Verfügung.