HyperAIHyperAI
il y a 2 mois

Cascade R-CNN : Détection d'objets de haute qualité et segmentation d'instances

Zhaowei Cai; Nuno Vasconcelos
Cascade R-CNN : Détection d'objets de haute qualité et segmentation d'instances
Résumé

Dans le domaine de la détection d'objets, le seuil de l'intersection sur l'union (IoU) est fréquemment utilisé pour définir les positifs/négatifs. Le seuil utilisé pour entraîner un détecteur définit sa \textit{qualité}. Bien que le seuil couramment utilisé de 0,5 conduise à des détections bruyantes (de faible qualité), les performances de détection se détériorent souvent pour des seuils plus élevés. Ce paradoxe de la détection de haute qualité a deux causes : 1) le surapprentissage, dû à la disparition des échantillons positifs pour des seuils importants, et 2) une incompatibilité de qualité entre le détecteur et les hypothèses lors de l'inférence. Une architecture de détection d'objets en plusieurs étapes, nommée Cascade R-CNN, composée d'une séquence de détecteurs entraînés avec des seuils IoU croissants, est proposée pour résoudre ces problèmes. Les détecteurs sont entraînés séquentiellement, en utilisant la sortie d'un détecteur comme ensemble d'entraînement pour le suivant. Cette rééchantillonnage améliore progressivement la qualité des hypothèses, garantissant un ensemble d'entraînement positif de taille équivalente pour tous les détecteurs et minimisant le surapprentissage. La même cascade est appliquée lors de l'inférence, afin d'éliminer les incompatibilités de qualité entre les hypothèses et les détecteurs. Une implémentation du Cascade R-CNN sans ajouts superflus atteint des performances de pointe sur l'ensemble de données COCO et améliore considérablement la détection de haute qualité sur des ensembles de données génériques et spécifiques d'objets, y compris VOC, KITTI, CityPerson et WiderFace. Enfin, le Cascade R-CNN est généralisé à la segmentation d'instances, avec des améliorations non triviales par rapport au Mask R-CNN. Pour faciliter les recherches futures, deux implémentations sont mises à disposition sur \url{https://github.com/zhaoweicai/cascade-rcnn} (Caffe) et \url{https://github.com/zhaoweicai/Detectron-Cascade-RCNN} (Detectron).