HyperAIHyperAI
il y a 18 jours

Détection hiérarchique de tir

{ Xuelong Li, Jungong Han, Yanwei Pang, Jiale Cao}
Détection hiérarchique de tir
Résumé

Le détecteur à une seule image prédit simultanément les catégories d'objets et les décalages de régression des boîtes par défaut. Malgré son efficacité élevée, cette architecture présente certaines imprécisions dans sa conception : (1) Au cours de l'inférence, le résultat de classification attribué à la boîte par défaut est incorrectement transféré à la boîte régressée ; (2) Une seule étape de régression s'avère insuffisante pour garantir une détection précise des objets. Pour résoudre le premier problème, nous proposons un nouveau module appelé reg-offset-cls (ROC), composé de trois étapes hiérarchiques : régression de boîtes, prédiction de la localisation d'échantillonnage des caractéristiques, puis classification de la boîte régressée à l'aide des caractéristiques provenant des emplacements de décalage. Pour pallier également le second problème, nous introduisons un détecteur hiérarchique à une seule image (HSD), qui empile deux modules ROC et un module d'amélioration des caractéristiques. Le deuxième module ROC prend en entrée les boîtes régressées ainsi que les localisations d'échantillonnage des caractéristiques issues du premier module ROC. Par ailleurs, le module d'amélioration des caractéristiques placé entre les deux modules ROC vise à extraire à la fois le contexte local et le contexte non local. Les expériences menées sur les jeux de données MS COCO et PASCAL VOC démontrent l'efficacité supérieure du HSD proposé. Sans recourir à des améliorations supplémentaires, le HSD dépasse tous les méthodes à une seule image en termes de performance tout en opérant à une vitesse en temps réel.