HyperAIHyperAI
vor 11 Tagen

Skalenequivarianz verbessert Siamese-Verfolgung

Ivan Sosnovik, Artem Moskalev, Arnold Smeulders
Skalenequivarianz verbessert Siamese-Verfolgung
Abstract

Siamese-Tracker wandeln die Objektsverfolgung in eine Ähnlichkeitsschätzung zwischen einem Template und den Kandidatenregionen im Frame um. Mathematisch ist eine der zentralen Voraussetzungen für den Erfolg der Ähnlichkeitsfunktion die Translationsequivarianz. Nicht-translationsequivariante Architekturen führen während des Trainings zu einer positionsabhängigen Verzerrung, wodurch die Position des Zielobjekts aus dem Merkmalsraum schwer wiederherzustellen ist. In realen Szenarien unterliegen Objekte neben Translationen weiteren Transformationen wie Rotation oder Skalierung. Wenn das Modell keine interne Mechanismen zur Bewältigung dieser Veränderungen besitzt, kann die Ähnlichkeit abnehmen. In dieser Arbeit konzentrieren wir uns auf die Skalierung und zielen darauf ab, das Siamese-Netzwerk mit einer zusätzlichen, eingebauten Skalierungsequivarianz auszustatten, um die natürlichen Variationen des Objekts bereits im Vorfeld erfassen zu können. Wir entwickeln die Theorie für skalenäquivalente Siamese-Tracker und stellen ein einfaches Rezept vor, mit dem eine Vielzahl bestehender Tracker skalenäquivalent gemacht werden kann. Wir präsentieren SE-SiamFC, eine skalenäquivalente Variante von SiamFC, die gemäß diesem Rezept konstruiert wurde. Wir führen Experimente auf den Benchmarks OTB und VOT sowie auf den synthetisch generierten Datensätzen T-MNIST und S-MNIST durch. Unsere Ergebnisse zeigen, dass eine eingebaute, zusätzliche Skalierungsequivarianz für die visuelle Objektsverfolgung von erheblichem Nutzen ist.

Skalenequivarianz verbessert Siamese-Verfolgung | Neueste Forschungsarbeiten | HyperAI