Détection probabiliste en deux étapes

Nous proposons une interprétation probabiliste de la détection d'objets en deux étapes. Nous montrons que cette interprétation justifie un certain nombre de pratiques d'entraînement empiriques courantes, tout en suggérant des améliorations pour les pipelines de détection en deux étapes. Plus précisément, la première étape doit estimer des probabilités appropriées d’objet contre fond, lesquelles doivent ensuite influencer le score global du détecteur. Un réseau standard de proposition de régions (RPN) ne parvient pas à estimer ces probabilités de manière suffisamment fiable, mais de nombreux détecteurs en une seule étape le peuvent. Nous démontrons comment construire un détecteur en deux étapes probabiliste à partir de n'importe quel détecteur en une seule étape de pointe. Les détecteurs ainsi obtenus sont plus rapides et plus précis que leurs prédécesseurs en une ou deux étapes. Notre détecteur atteint un score de 56,4 mAP sur le jeu de test-dev COCO avec une évaluation à échelle unique, surpassant tous les résultats publiés à ce jour. En utilisant un modèle de base léger, il atteint 49,2 mAP sur COCO à 33 fps sur une Titan Xp, dépassant ainsi le modèle populaire YOLOv4.