HyperAIHyperAI
il y a 17 jours

Une nouvelle couche d'extraction de région d'intérêt pour la segmentation d'instances

Leonardo Rossi, Akbar Karimi, Andrea Prati
Une nouvelle couche d'extraction de région d'intérêt pour la segmentation d'instances
Résumé

Étant donné la diffusion croissante des architectures de réseaux de neurones profonds pour les tâches de vision par ordinateur, plusieurs nouvelles applications deviennent désormais de plus en plus réalisables. Parmi celles-ci, une attention particulière a récemment été portée à la segmentation d'instances, en exploitant les résultats obtenus par les réseaux à deux étapes (tels que Mask R-CNN ou Faster R-CNN), dérivés de R-CNN. Dans ces architectures complexes, une fonction cruciale est assurée par la couche d'extraction des régions d'intérêt (RoI), chargée d'extraire un sous-ensemble cohérent de caractéristiques à partir d'une seule couche du réseau pyramidal de caractéristiques (FPN) placée au-dessus du modèle principal (backbone).Cette étude s'inscrit dans le besoin de surmonter les limites des extracteurs de RoI existants, qui ne sélectionnent qu'une seule couche (la meilleure) parmi celles du FPN. Notre intuition repose sur le fait que toutes les couches du FPN conservent des informations utiles. Ainsi, la couche proposée (appelée Generic RoI Extractor - GRoIE) intègre des blocs non locaux et des mécanismes d'attention afin d'améliorer les performances.Une étude ablation complète au niveau des composants est menée afin d'identifier l'ensemble optimal d'algorithmes et de paramètres pour la couche GRoIE. De plus, GRoIE peut être intégrée de manière transparente à tout architecture à deux étapes, tant pour les tâches de détection d'objets que pour la segmentation d'instances. Les améliorations apportées par l'utilisation de GRoIE dans différentes architectures de pointe sont donc également évaluées. La couche proposée permet d'obtenir une amélioration allant jusqu'à 1,1 % en AP pour la détection de boîtes englobantes et jusqu'à 1,7 % en AP pour la segmentation d'instances.Le code source est disponible publiquement sur le dépôt GitHub à l'adresse suivante : https://github.com/IMPLabUniPr/mmdetection/tree/groie_dev