Apprentissage amélioré des frontières pour la segmentation d'objets de type verre

Des objets semblant au verre, tels que les fenêtres, les bouteilles et les miroirs, sont couramment présents dans le monde réel. La détection de ces objets présente de nombreuses applications, notamment dans la navigation et la saisie par les robots. Toutefois, cette tâche s’avère particulièrement difficile en raison des scènes arbitraires situées derrière les objets en verre. Ce papier vise à résoudre le problème de segmentation des objets en verre grâce à un apprentissage amélioré des contours. Plus précisément, nous proposons tout d’abord un nouveau module différentiel raffiné capable de produire des indices de contour plus fins. Nous introduisons ensuite un module de réseau de convolution par graphe basé sur les points, sensible aux arêtes, afin de modéliser la forme globale le long du contour. En combinant ces deux modules, nous concevons un décodeur capable de générer des résultats de segmentation précis et propres, en particulier le long des contours des objets. Ces deux modules sont légers et efficaces : ils peuvent être intégrés à divers modèles de segmentation. Des expériences étendues menées sur trois jeux de données récents dédiés à la segmentation des objets en verre — Trans10k, MSD et GDD — montrent que notre approche établit de nouveaux états de l’art. Nous démontrons également les fortes capacités de généralisation de notre méthode sur trois jeux de données de segmentation génériques : Cityscapes, BDD et COCO Stuff. Le code source et les modèles sont disponibles à l’adresse suivante : \url{https://github.com/hehao13/EBLNet}.