HyperAIHyperAI
il y a 2 mois

Approximation récurrente d'échelle pour la détection d'objets dans les CNN

Yu Liu; Hongyang Li; Junjie Yan; Fangyin Wei; Xiaogang Wang; Xiaoou Tang
Approximation récurrente d'échelle pour la détection d'objets dans les CNN
Résumé

Étant donné que les réseaux de neurones convolutifs (CNN) ne disposent pas d'un mécanisme inhérent pour gérer les grandes variations d'échelle, il est nécessaire de calculer les cartes de caractéristiques plusieurs fois pour la détection d'objets à différentes échelles, ce qui constitue une bouteille d'étranglement en termes de coût computationnel dans la pratique. Pour remédier à cela, nous avons conçu une approximation récurrente d'échelle (RSA) permettant de calculer la carte de caractéristiques une seule fois, et grâce à cette carte unique, nous pouvons approximer les autres cartes sur différents niveaux. Au cœur de l'RSA se trouve le mécanisme de déploiement récursif : étant donné une carte initiale à une échelle particulière, il génère une prédiction à une échelle plus petite, soit la moitié de la taille de l'entrée.Pour augmenter encore l'efficacité et la précision du système, nous avons (a) : conçu un réseau prévisionnel d'échelle pour prédire globalement les échelles potentielles présentes dans l'image, car il n'est pas nécessaire de calculer des cartes sur tous les niveaux de la pyramide. (b) : proposé un réseau de retraçage des points clés (LRN) pour relocaliser les positions des points clés régressés et générer un score de confiance pour chaque point clé ; le LRN peut efficacement atténuer les faux positifs dus aux erreurs cumulées dans l'RSA. Le système complet peut être formé bout à bout dans un cadre unifié de CNN. Les expériences montrent que notre algorithme proposé est supérieur aux méthodes actuelles sur des bancs d'essai de détection faciale et obtient des résultats comparables pour la génération générique de propositions. Le code source de l'RSA est disponible sur github.com/sciencefans/RSA-for-object-detection.

Approximation récurrente d'échelle pour la détection d'objets dans les CNN | Articles de recherche récents | HyperAI