End-to-End-Darstellungslernen für die Korrelationsfilter-basierte Verfolgung

Der Korrelationsfilter ist ein Algorithmus, der eine lineare Vorlage trainiert, um zwischen Bildern und ihren Verschiebungen zu unterscheiden. Er eignet sich gut für die Objekterkennung, da seine Formulierung im Fourier-Bereich eine schnelle Lösung ermöglicht, wodurch das Detektormodell bei jedem Frame neu trainiert werden kann. Frühere Arbeiten, die den Korrelationsfilter verwendeten, haben jedoch Merkmale verwendet, die entweder manuell entwickelt wurden oder für eine andere Aufgabe trainiert wurden. Diese Arbeit überwindet diese Einschränkung erstmals, indem der Korrelationsfilter-Lerner, der eine geschlossene Lösungsform hat, als differenzierbares Layer in einem tiefen neuronalen Netzwerk interpretiert wird. Dies ermöglicht das Lernen von tiefen Merkmalen, die eng mit dem Korrelationsfilter gekoppelt sind. Experimente zeigen, dass unsere Methode den wichtigen praktischen Vorteil hat, leichte Architekturen bei hohen Frameraten auf Stand der Technik zu bringen.