HyperAIHyperAI
il y a 16 jours

AGSS-VOS : Segmentation d'objets vidéo à une seule image guidée par l'attention

{ Jiaya Jia, Xiaojuan Qi, Huaijia Lin}
AGSS-VOS : Segmentation d'objets vidéo à une seule image guidée par l'attention
Résumé

La plupart des approches actuelles de segmentation d'objets dans les vidéos traitent les objets séparément, ce qui entraîne un coût computationnel élevé lorsqu'il existe plusieurs objets. Dans cet article, nous proposons AGSS-VOS, une méthode permettant de segmenter plusieurs objets en une seule passe avant (feed-forward) grâce à des modules indépendants de l'instance et des modules spécifiques à l'instance. Les informations provenant de ces deux modules sont fusionnées par un décodeur guidé par une attention afin de segmenter simultanément toutes les instances d'objets en un seul parcours. Le cadre global est entièrement entraînable de manière end-to-end grâce à une perte d'intersection sur union (IoU) par instance. Les résultats expérimentaux sur les jeux de données Youtube-VOS et DAVIS-2017 démontrent que AGSS-VOS atteint des performances compétitives tant en précision qu'en efficacité.

AGSS-VOS : Segmentation d'objets vidéo à une seule image guidée par l'attention | Articles de recherche récents | HyperAI