HyperAIHyperAI
vor 2 Monaten

FODVid: Flussgeleitete Objekterkennung in Videos

Singh, Silky ; Deshmukh, Shripad ; Sarkar, Mausoom ; Jain, Rishabh ; Hemani, Mayur ; Krishnamurthy, Balaji
FODVid: Flussgeleitete Objekterkennung in Videos
Abstract

Die Segmentierung von Objekten in Videos ist aufgrund von Nuancen wie Bewegungsunschärfe, Parallaxe, Verdeckungen und Änderungen der Beleuchtung herausfordernd. Anstatt diese Nuancen einzeln anzugehen, konzentrieren wir uns darauf, eine allgemein anwendbare Lösung zu entwickeln, die eine Überanpassung an individuelle Feinheiten vermeidet. Eine solche Lösung würde uns auch enorme Ressourcen sparen, die bei der manuellen Annotation von Video-Korpora aufgewendet werden. Um die Video-Objekt-Segmentierung (VOS) in einem unüberwachten Szenario zu lösen, schlagen wir einen neuen Prozess (FODVid) vor, der auf dem Konzept basiert, Segmentierungsresultate durch flussgeführte Graph-Cut-Verfahren und zeitliche Konsistenz zu leiten. Im Wesentlichen entwerfen wir ein Segmentierungsmodell, das Intra-Frame-Erscheinungsmerkmale und Flussähnlichkeiten sowie die Inter-Frame-Zeitfortsetzung der betrachteten Objekte berücksichtigt. Wir führen eine umfangreiche experimentelle Analyse unserer einfachen Methodik am Standard-DATENSatz DAVIS16 durch. Obwohl simpel, erzielt unser Ansatz Ergebnisse, die mit den bestehenden Top-Ansätzen in unüberwachter VOS vergleichbar sind (innerhalb eines Bereichs von ~2 mIoU). Die Einfachheit und Effektivität unserer Technik eröffnet neue Forschungspfade im Video-Bereich.

FODVid: Flussgeleitete Objekterkennung in Videos | Neueste Forschungsarbeiten | HyperAI