Segmentation d'instances basée sur les contours génériques récurrents avec apprentissage progressif

La segmentation d'instances basée sur les contours a fait l'objet d'une étude intensive, en raison de sa flexibilité et de son élégance dans le traitement des objets visuels au sein de fonds complexes. Dans ce travail, nous proposons une nouvelle architecture de réseau profond, nommée PolySnake, dédiée à la segmentation d'instances générique basée sur les contours. Inspirée par l'algorithme classique Snake, PolySnake atteint des performances supérieures et robustes grâce à une stratégie itérative et progressive de raffinement des contours. Techniquement, PolySnake introduit un opérateur de mise à jour récurrente afin d'estimer itérativement le contour de l'objet. Elle maintient une seule estimation du contour, progressivement déformée pour s'approcher de la frontière de l'objet. À chaque itération, PolySnake construit une représentation sémantique riche pour le contour actuel, qu'elle alimente dans l'opérateur récurrent afin d'ajuster davantage le contour. Grâce à ces raffinements itératifs, le contour converge progressivement vers un état stable qui enclose étroitement l'instance de l'objet. Au-delà du cadre de la segmentation d'instances générale, des expériences étendues ont été menées afin de valider l'efficacité et la généralisation de PolySnake dans deux scénarios de tâches spécifiques supplémentaires : la détection de texte scénique et la détection de lignes de circulation. Les résultats montrent que la méthode proposée surpassent les approches avancées existantes sur plusieurs benchmarks largement utilisés, dans les trois tâches considérées. Le code source et les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/fh2019ustc/PolySnake