Condensation-Net : Architecture de réseau à faible consommation de mémoire comprenant des couches de pooling inter-canaux et des cartes de caractéristiques virtuelles

Les réseaux de neurones convolutifs légers constituent un sujet de recherche important dans le domaine de la vision embarquée. Afin de réaliser des tâches de reconnaissance d’images sur une plateforme matérielle à ressources limitées, il est nécessaire de réduire à la fois la taille de la mémoire et le coût computationnel. Les contributions de cet article sont les suivantes. Premièrement, nous proposons un algorithme permettant de traiter une architecture de réseau spécifique (Condensation-Net) sans augmenter la mémoire maximale nécessaire pour stocker les cartes de caractéristiques. L’architecture des cartes de caractéristiques virtuelles permet de réduire de 26,5 % le débit mémoire en calculant les résultats du pooling entre canaux avant de stocker la carte de caractéristiques en mémoire. Deuxièmement, nous démontrons que le pooling entre canaux améliore la précision des tâches de détection d’objets, telles que la détection faciale, en augmentant le nombre de poids des filtres. Par rapport à Tiny-YOLOv2, l’amélioration de la précision atteint 2,0 % pour les réseaux quantifiés et 1,5 % pour les réseaux à précision pleine, lorsque le taux de faux positifs est fixé à 0,1. Enfin, les résultats d’analyse montrent que la surcharge liée à la prise en charge du pooling entre canaux via l’architecture matérielle proposée est négligeable. Le coût mémoire supplémentaire nécessaire pour soutenir Condensation-Net représente seulement 0,2 % de la taille totale, tandis que le nombre supplémentaire de portes logiques n’atteint que 1,0 % de la taille totale.