Segmentation d'instances avec une prise en compte approfondie de l'occlusion à l'aide de bi-couches chevauchantes

La segmentation d'objets fortement chevauchants est un défi, car il n'y a généralement pas de distinction entre les contours réels des objets et les limites d'occlusion. Contrairement aux méthodes précédentes de segmentation d'instances en deux étapes, nous modélisons la formation d'image comme une composition de deux couches chevauchantes, et proposons le Réseau de Convolution Bicouche (Bilayer Convolutional Network, BCNet), où la couche GCN supérieure détecte les objets occultants (occluder) et la couche GCN inférieure infère les instances partiellement occultées (occludee). La modélisation explicite de la relation d'occlusion avec une structure bicouche permet naturellement de découpler les frontières des instances occultantes et occultées, tout en prenant en compte leur interaction lors de la régression du masque.Nous validons l'efficacité du découplage bicouche sur des détecteurs d'objets à une étape et à deux étapes, avec différentes architectures de base et des choix différents pour les couches du réseau. Malgré sa simplicité, de nombreuses expériences menées sur COCO et KINS montrent que notre BCNet sensible aux occlusions obtient des gains de performance importants et cohérents, particulièrement dans les cas d'occlusions importantes. Le code source est disponible à l'adresse suivante : https://github.com/lkeab/BCNet.