HyperAIHyperAI
il y a 2 mois

Segmentation collaborative d'objets vidéo par intégration avant-plan-arrière-plan

Zongxin Yang; Yunchao Wei; Yi Yang
Segmentation collaborative d'objets vidéo par intégration avant-plan-arrière-plan
Résumé

Ce travail examine les principes de l'apprentissage d'embeddings pour aborder le défi de la segmentation semi-supervisée d'objets vidéo. Contrairement aux approches précédentes qui ne s'intéressent qu'à l'apprentissage d'embeddings à partir des pixels de l'objet(s) en premier plan, nous considérons que le fond doit être traité avec autant d'importance. Nous proposons donc une approche de segmentation collaborative d'objets vidéo par intégration du premier et du second plan (CFBI). Notre méthode CFBI impose implicitement que les embeddings de caractéristiques issus de l'objet en premier plan cible et de son arrière-plan correspondant soient contrastés, ce qui améliore les résultats de segmentation. Grâce aux embeddings de caractéristiques provenant à la fois du premier et du second plan, notre CFBI effectue un processus de correspondance entre la séquence de référence et la séquence prédite, à la fois au niveau des pixels et des instances, rendant ainsi CFBI robuste face à diverses échelles d'objets. Nous avons mené des expériences approfondies sur trois benchmarks populaires, à savoir DAVIS 2016, DAVIS 2017 et YouTube-VOS. Notre CFBI atteint respectivement des performances (J$F) de 89,4 %, 81,9 % et 81,4 %, surpassant toutes les autres méthodes de pointe. Code : https://github.com/z-x-yang/CFBI.

Segmentation collaborative d'objets vidéo par intégration avant-plan-arrière-plan | Articles de recherche récents | HyperAI