HyperAIHyperAI
il y a 17 jours

FemtoDet : Une base de détection d'objets pour les compromis énergie contre performance

Peng Tu, Xu Xie, Guo AI, Yuexiang Li, Yawen Huang, Yefeng Zheng
FemtoDet : Une base de détection d'objets pour les compromis énergie contre performance
Résumé

Les détecteurs efficaces destinés aux dispositifs périphériques sont souvent optimisés en fonction de paramètres ou de métriques de vitesse, qui restent faiblement corrélés avec la consommation énergétique des détecteurs. Toutefois, certaines applications visuelles basées sur les réseaux de neurones convolutifs, telles que les caméras de surveillance toujours allumées, sont particulièrement sensibles aux contraintes énergétiques. Ce papier vise à établir une référence en concevant des détecteurs capables d’atteindre un compromis optimal entre consommation énergétique et performance, à partir de deux angles principaux :1) Nous menons une analyse approfondie de divers architectures de CNN afin d’identifier des architectures à faible consommation énergétique, en sélectionnant notamment des fonctions d’activation, des opérateurs de convolution et des structures de fusion de caractéristiques au niveau du « neck ». Ces détails souvent sous-estimés dans les travaux antérieurs ont un impact significatif sur la consommation énergétique des détecteurs ;2) Pour surmonter le dilemme classique entre performance et consommation énergétique, nous proposons un détecteur équilibré piloté par l’énergie, basé sur des composants à faible consommation identifiés, nommé \textit{FemtoDet}. En plus de sa construction novatrice, nous améliorons FemtoDet en optimisant les opérations de convolution et la stratégie d’entraînement. Plus précisément, nous introduisons un nouveau module d’amélioration des frontières d’instance (IBE) pour optimiser les convolutions, afin de résoudre le conflit entre la capacité limitée des CNNs et les exigences des tâches de détection dans des représentations spatiales variées. Nous proposons également une stratégie d’entraînement améliorée par « restart récursif » (RecWR), permettant d’échapper à l’optimum local des détecteurs légers, en tenant compte du décalage des données induit par les augmentations couramment utilisées.En résultat, FemtoDet, avec seulement 68,77 k paramètres, atteint un score compétitif de 46,3 AP50 sur le jeu de données PASCAL VOC, ainsi que 1,11 W et 64,47 FPS sur la plateforme CPU Qualcomm Snapdragon 865. Des expériences étendues sur les jeux de données COCO et TJU-DHD montrent que la méthode proposée obtient des résultats compétitifs dans des scénarios variés.