Command Palette
Search for a command to run...
Schnelle Video-Objektsegmentierung mittels dynamischem Zielnetzwerk
Schnelle Video-Objektsegmentierung mittels dynamischem Zielnetzwerk
You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang
Zusammenfassung
Wir stellen ein neues Modell für schnelle und genaue Video-Objektsegmentierung vor. Es besteht aus zwei konvolutionellen neuronalen Netzen: einem Dynamic Targeting Network (DTN) und einem Mask Refinement Network (MRN). Das DTN lokalisiert das Objekt, indem es dynamisch auf interessierende Regionen in der Nähe des Zielobjekts fokussiert. Die Zielregion wird durch das DTN über zwei Unterströme vorhergesagt: den Box Propagation (BP)-Ström und den Box Re-identification (BR)-Ström. Der BP-Ström ist schneller, jedoch weniger effektiv bei Objekten mit großer Deformation oder Verdeckung. Der BR-Ström erzielt bessere Ergebnisse in anspruchsvollen Szenarien, erfordert jedoch einen höheren Rechenaufwand. Wir schlagen ein Entscheidungsmodul (DM) vor, das adaptiv bestimmt, welcher Unterstrom für jeden Frame verwendet werden soll. Schließlich wird das MRN eingesetzt, um die Segmentierung innerhalb der Zielregion vorherzusagen. Experimentelle Ergebnisse auf zwei öffentlichen Datensätzen zeigen, dass das vorgeschlagene Modell bestehende Methoden sowohl hinsichtlich Genauigkeit als auch Effizienz deutlich übertrifft, ohne Online-Training zu benötigen, und in der Genauigkeit mit Methoden, die auf Online-Training basieren, vergleichbar ist, jedoch eine um eine Größenordnung schnellere Geschwindigkeit erreicht.