Segmentation Rapide et Précise d'Objets Vidéo en Ligne par le Suivi de Parties

La segmentation d'objets en vidéo en ligne est une tâche complexe car elle nécessite de traiter la séquence d'images à temps et avec précision. Pour segmenter un objet cible tout au long de la vidéo, de nombreuses méthodes basées sur les CNN (Convolutional Neural Networks) ont été développées, impliquant un affinage intensif sur le masque d'objet de la première image, ce qui est coûteux en temps pour les applications en ligne. Dans cet article, nous proposons un algorithme de segmentation d'objets en vidéo rapide et précis qui peut démarrer immédiatement le processus de segmentation dès réception des images. Nous utilisons d'abord une méthode de suivi basée sur les parties pour gérer les facteurs difficiles tels que les grandes déformations, l'occlusion et le fond encombré. Sur la base des boîtes englobantes tracées des parties, nous construisons un réseau de segmentation centré sur la région d'intérêt pour générer des masques partiels. Enfin, une fonction de notation basée sur la similarité est adoptée pour affiner ces parties d'objet en les comparant aux informations visuelles de la première image. Notre méthode offre des performances favorables par rapport aux algorithmes de pointe en termes de précision sur l'ensemble de données DAVIS (Densely Annotated Video Segmentation), tout en atteignant des performances d'exécution bien plus rapides.