Exploiter la saillance pour le segmention d'objets à partir d'étiquettes de niveau d'image

Ces dernières années ont vu des améliorations remarquables dans la tâche de labellisation sémantique. Cependant, les méthodes d'avant-garde reposent sur des annotations à grande échelle au niveau des pixels. Cet article étudie le problème de l'entraînement d'un réseau de labellisation sémantique pixel par pixel à partir d'annotations au niveau des images pour les classes d'objets présentes. Récemment, il a été démontré que des graines de haute qualité indiquant des régions d'objets discriminantes peuvent être obtenues à partir de labels au niveau des images. Sans informations supplémentaires, l'obtention de l'étendue complète de l'objet est un problème intrinsèquement mal posé en raison des co-occurrences. Nous proposons d'utiliser un modèle de saillance comme information supplémentaire et ainsi d'exploiter les connaissances a priori sur l'étendue de l'objet et les statistiques d'image. Nous montrons comment combiner ces deux sources d'information afin de retrouver 80 % des performances supervisées entièrement - ce qui constitue le nouvel état de l'art en matière d'entraînement faiblement supervisé pour la labellisation sémantique pixel par pixel. Le code est disponible à l'adresse https://goo.gl/KygSeb.