HyperAIHyperAI
il y a 2 mois

Segmentation d'objets vidéo en un seul coup

Sergi Caelles; Kevis-Kokitsi Maninis; Jordi Pont-Tuset; Laura Leal-Taixé; Daniel Cremers; Luc Van Gool
Segmentation d'objets vidéo en un seul coup
Résumé

Ce document aborde la tâche de segmentation d'objets vidéo semi-supervisée, c'est-à-dire la séparation d'un objet du fond dans une vidéo, en se basant sur le masque de la première image. Nous présentons One-Shot Video Object Segmentation (OSVOS), une architecture de réseau neuronal entièrement convolutif capable de transférer successivement des informations sémantiques génériques apprises sur ImageNet à la tâche de segmentation de premier plan, et enfin d'apprendre l'apparence d'un seul objet annoté de la séquence de test (d'où le terme "one-shot"). Bien que toutes les images soient traitées indépendamment, les résultats sont cohérents et stables dans le temps. Nous menons des expériences sur deux bases de données annotées pour la segmentation vidéo, qui montrent que OSVOS est rapide et améliore l'état de l'art avec une marge significative (79,8 % contre 68,0 %).

Segmentation d'objets vidéo en un seul coup | Articles de recherche récents | HyperAI