Proposition, Suivi et Segmentation (PSS) : Un Réseau en Cascade pour la Segmentation d'Objets Vidéo
La segmentation d'objets dans les vidéos (VOS) vise à suivre des objets au niveau des pixels en se basant uniquement sur les annotations de la première image. En raison des grandes variations visuelles des objets dans les vidéos et du manque d'échantillons d'entraînement, cette tâche reste difficile malgré le développement croissant de l'apprentissage profond. Pour résoudre le problème de VOS, nous apportons plusieurs nouvelles perspectives grâce à notre cadre unifié comprenant des composants de proposition d'objets, de suivi et de segmentation. Le réseau de proposition d'objets transfère l'information d'objectivité comme une connaissance générale dans VOS ; le réseau de suivi identifie l'objet cible parmi les propositions ; et le réseau de segmentation est effectué sur la base des résultats du suivi avec un nouveau schéma d'adaptation de modèle basé sur une référence dynamique. De nombreuses expériences ont été menées sur l'ensemble de données DAVIS 2017 et l'ensemble de données YouTube-VOS, et notre méthode atteint des performances de pointe sur plusieurs benchmarks de segmentation d'objets dans les vidéos. Nous rendons le code publiquement disponible à l'adresse https://github.com/sydney0zq/PTSNet.