Alpha-Refine: Steigerung der Tracking-Leistung durch präzise Schätzung von Bounding Boxes

Visual Object Tracking zielt darauf ab, die Bounding Box für ein gegebenes Ziel präzise zu schätzen, was aufgrund von Faktoren wie Verformung und Verdeckung eine herausfordernde Aufgabe darstellt. Viele neuere Tracker verwenden eine mehrstufige Tracking-Strategie, um die Qualität der Bounding Box-Schätzung zu verbessern. Diese Methoden lokalisieren zunächst grob das Ziel und verfeinern dann die anfängliche Vorhersage in nachfolgenden Stufen. Allerdings leiden bestehende Ansätze weiterhin unter begrenzter Genauigkeit, und die Kopplung der verschiedenen Stufen beschränkt erheblich die Übertragbarkeit der Methode. In dieser Arbeit wird ein neuartiges, flexibles und präzises Verfeinerungsmodul namens Alpha-Refine (AR) vorgestellt, das die Qualität der Bounding Box-Schätzung grundlegender Tracker signifikant verbessern kann. Durch die Untersuchung einer Reihe von Design-Optionen kommt man zu dem Schluss, dass der Schlüssel für einen erfolgreichen Verfeinerungsprozess darin besteht, detaillierte räumliche Informationen so weit wie möglich zu extrahieren und zu bewahren. In Übereinstimmung mit diesem Prinzip setzt Alpha-Refine eine pixelweise Korrelation, einen Ecken-Vorhersage-Kopf und einen zusätzlichen Masken-Kopf als zentrale Komponenten ein. Umfassende Experimente auf den Benchmarks TrackingNet, LaSOT, GOT-10K und VOT2020 mit mehreren Basis-Trackern zeigen, dass unsere Methode die Leistung der Basis-Tracker erheblich verbessert, ohne dabei eine signifikante zusätzliche Verzögerung zu verursachen. Das vorgeschlagene Alpha-Refine-Verfahren führt zu einer Reihe ver stärkter Tracker, wobei ARSiamRPN (AR verstärkter SiamRPNpp) und ARDiMP50 (AR verstärkter DiMP50) ein gutes Gleichgewicht zwischen Effizienz und Genauigkeit erreichen, während ARDiMPsuper (AR verstärkter DiMP-super) eine sehr konkurrenzfähige Leistung in Echtzeit erreicht. Der Quellcode und vortrainierte Modelle sind unter https://github.com/MasterBin-IIAU/AlphaRefine verfügbar.