Command Palette
Search for a command to run...
Segmentation en une seule tentative dans un environnement encombré
Segmentation en une seule tentative dans un environnement encombré
Michaelis Claudio Bethge Matthias Ecker Alexander S.
Résumé
Nous abordons le problème de la segmentation en une seule tentative : localiser et segmenter un objet auparavant inconnu dans une scène encombrée, à partir d’un unique exemple d'instruction. Nous proposons un nouveau jeu de données, que nous appelons cluttered Omniglot. En utilisant une architecture de base combinant une embedding Siamese pour la détection et un U-net pour la segmentation, nous montrons que l’augmentation du niveau d’encombrement rend progressivement la tâche plus difficile. En évaluant différents aspects du problème à l’aide de modèles oracles ayant accès à diverses quantités d’informations de vérité terrain, nous démontrons que, dans ce type de tâche de recherche visuelle, la détection et la segmentation sont deux problèmes intrinsèquement liés, dont la résolution mutuelle facilite l’une et l’autre. Nous introduisons donc MaskNet, un modèle amélioré qui s’intéresse à plusieurs emplacements candidats, génère des propositions de segmentation afin d’éliminer le bruit de fond provenant de l’encombrement, puis sélectionne parmi les objets segmentés. Nos résultats suggèrent que des modèles de reconnaissance d’images fondés sur un raffinement itératif de la détection d’objets et de la segmentation du premier plan pourraient offrir une voie efficace pour traiter des scènes fortement encombrées.