SOLOv2 : Segmentation d'instances dynamique et rapide

Dans cette étude, nous visons à construire un cadre d'instance segmentation simple, direct et rapide avec de hautes performances. Nous suivons le principe de la méthode SOLO de Wang et al., « SOLO : segmenter les objets par leur emplacement ». Importamment, nous allons plus loin en apprenant dynamiquement la tête de masque du segmenteur d'objets afin que celle-ci soit conditionnée par l'emplacement. Plus précisément, la branche de masque est décomposée en une branche de noyau de masque et une branche de caractéristiques de masque, qui sont respectivement responsables d'apprendre le noyau de convolution et les caractéristiques convolues. De plus, nous proposons Matrix NMS (non-maximum suppression) pour réduire considérablement le surcoût en temps d'inférence lié à la NMS des masques. Notre Matrix NMS effectue la NMS en une seule étape grâce à des opérations matricielles parallèles, offrant ainsi de meilleurs résultats. Nous présentons un système d'instance segmentation simple et direct, surpassant plusieurs méthodes de pointe en termes de vitesse et de précision. Une version allégée de SOLOv2 s'exécute à 31,3 images par seconde (FPS) et atteint une précision moyenne (AP) de 37,1 %. En outre, nos résultats exceptionnels en détection d'objets (issus du sous-produit du masque) et en segmentation panoramique montrent le potentiel d'être utilisés comme nouvelle base solide pour nombreuses tâches de reconnaissance au niveau des instances, outre l'instance segmentation. Le code source est disponible à l'adresse suivante : https://git.io/AdelaiDet