Schnelle visuelle Objekverfolgung mit rotierten Begrenzungsboxen

In dieser Arbeit präsentieren wir einen neuen Algorithmus, der Ellipsenanpassung verwendet, um den Rotationswinkel und die Größe des Begrenzungsrahmens mit der Segmentierung (Mask) am Zielobjekt für Online- und Echtzeit-Visuelles Objektnachverfolgen zu schätzen. Unsere Methode, SiamMask_E, verbessert das Verfahren zur Anpassung des Begrenzungsrahmens des aktuellen führenden Objektnachverfolgungsalgorithmus SiamMask und behält gleichzeitig eine schnelle Nachverfolgungs-Framerate (80 fps) auf einem System mit GPU (GeForce GTX 1080 Ti oder höher). Wir haben unseren Ansatz auf visuellen Objektnachverfolgungsdatensätzen getestet (VOT2016, VOT2018 und VOT2019), die mit rotierten Begrenzungsrahmen beschriftet wurden. Im Vergleich zum ursprünglichen SiamMask erreichten wir eine verbesserte Genauigkeit von 0,652 und einen EAO-Wert von 0,309 auf VOT2019, was jeweils 0,056 und 0,026 höher ist als beim ursprünglichen SiamMask. Die Implementierung ist auf GitHub verfügbar: https://github.com/baoxinchen/siammask_e.