Segmentation non supervisée d'objets vidéo à l'aide de réseaux bilatéraux basés sur le mouvement

Dans ce travail, nous étudions le problème de la segmentation d'objets vidéo non supervisée, dans lequel les objets en mouvement sont segmentés sans connaissance a priori de ces objets. Premièrement, nous proposons un réseau bilatéral basé sur le mouvement afin d'estimer le fond à partir des motifs de mouvement des régions non objets. Le réseau bilatéral réduit les régions faussement positives en identifiant avec précision les objets du fond. Ensuite, nous intégrons l'estimation du fond fournie par le réseau bilatéral avec les embeddings d'instances dans un graphe, permettant ainsi un raisonnement sur plusieurs cadres grâce à des arêtes du graphe reliant des pixels provenant de cadres différents. Nous classifions les nœuds du graphe en définissant et en minimisant une fonction de coût, puis nous segmentons les cadres vidéo en fonction des étiquettes des nœuds. La méthode proposée surpasser les méthodes d'état de l'art précédentes en segmentation d'objets vidéo non supervisée sur les jeux de données DAVIS 2016 et FBMS-59.