Schnelle und genaue Online-Videosegmentierung durch Teileverfolgung

Die Online-Videosegmentierung von Objekten ist eine herausfordernde Aufgabe, da sie die zeitgerechte und genaue Verarbeitung der Bildsequenz erfordert. Um ein Zielobjekt durch das gesamte Video zu segmentieren, wurden zahlreiche CNN-basierte Methoden entwickelt, die stark an dem Objektmasken des ersten Frames angepasst werden. Dies ist jedoch für Online-Anwendungen zeitaufwendig. In dieser Arbeit schlagen wir einen schnellen und genauen Algorithmus zur Videosegmentierung von Objekten vor, der den Segmentierungsprozess sofort nach Eingang der Bilder starten kann. Zunächst nutzen wir eine teilbasierte Verfolgungsmethode, um Herausforderungen wie starke Deformationen, Verdeckungen und komplizierte Hintergründe zu bewältigen. Basierend auf den verfolgten Begrenzungsboxen der Teile bauen wir ein Region-of-Interest-Segmentierungsnetzwerk (Region-of-Interest Segmentation Network) auf, um Teilmasken zu generieren. Schließlich wird eine Ähnlichkeitsbasierte Bewertungsfunktion verwendet, um diese Objektteile durch Vergleich mit den visuellen Informationen im ersten Frame zu verfeinern. Unsere Methode erzielt vergleichbare Ergebnisse wie die besten aktuellen Algorithmen in Bezug auf Genauigkeit im DAVIS-Benchmark-Datensatz und weist gleichzeitig deutlich schnellere Laufzeitleistung auf.