HyperAIHyperAI
il y a 7 jours

R-CNN à raffinement récursif : segmentation d'instances avec rééquilibrage auto-RoI

Leonardo Rossi, Akbar Karimi, Andrea Prati
R-CNN à raffinement récursif : segmentation d'instances avec rééquilibrage auto-RoI
Résumé

Dans le domaine de la segmentation d'instances, la plupart des réseaux de deep learning les plus performants s'appuient actuellement sur des architectures en cascade, où plusieurs détecteurs d'objets sont entraînés séquentiellement, en ré-échantillonnant à chaque étape la vérité terrain (ground truth). Cette approche permet de résoudre le problème des échantillons positifs qui disparaissent exponentiellement. Toutefois, elle entraîne également une augmentation de la complexité du réseau en termes de nombre de paramètres. Pour pallier ce défaut, nous proposons R^3-CNN (Recursive Refined R-CNN), une architecture qui évite les duplications en introduisant un mécanisme itératif basé sur une boucle. Par ailleurs, elle obtient une amélioration de la qualité grâce à une technique de ré-échantillonnage récursif, où un seuil spécifique d'intersection sur union (IoU) est utilisé à chaque itération afin de couvrir de manière équilibrée le spectre des échantillons positifs. Nos expériences mettent en évidence que le mécanisme de boucle est spécifiquement encodé dans les poids du réseau, ce qui rend indispensable son utilisation au moment de l'inférence. L'architecture R^3-CNN surpasse le modèle récent HTC, tout en réduisant de manière significative le nombre de paramètres. Des expériences menées sur le jeu de données COCO minival 2017 montrent une amélioration des performances indépendamment du modèle de base utilisé. Le code est disponible en ligne à l'adresse suivante : https://github.com/IMPLabUniPr/mmdetection/tree/r3_cnn.

R-CNN à raffinement récursif : segmentation d'instances avec rééquilibrage auto-RoI | Articles de recherche récents | HyperAI