HyperAIHyperAI
il y a 17 jours

PP-PicoDet : Un détecteur d'objets en temps réel amélioré pour les appareils mobiles

Guanghua Yu, Qinyao Chang, Wenyu Lv, Chang Xu, Cheng Cui, Wei Ji, Qingqing Dang, Kaipeng Deng, Guanzhong Wang, Yuning Du, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma
PP-PicoDet : Un détecteur d'objets en temps réel amélioré pour les appareils mobiles
Résumé

L’équilibre entre précision et efficacité constitue un défi majeur dans la détection d’objets. Dans ce travail, nous nous consacrons à l’étude des optimisations clés et des choix architecturaux des réseaux neuronaux pour la détection d’objets, afin d’améliorer à la fois la précision et l’efficacité. Nous examinons la faisabilité de la stratégie sans ancres (anchor-free) sur des modèles légers de détection d’objets. Nous améliorons la structure d’architecture principale (backbone) et concevons une structure légère pour le « neck », ce qui renforce la capacité d’extraction de caractéristiques du réseau. Nous optimisons également la stratégie d’attribution des étiquettes et la fonction de perte afin de rendre l’entraînement plus stable et plus efficace. Grâce à ces améliorations, nous proposons une nouvelle famille de détecteurs en temps réel, nommée PP-PicoDet, qui atteint des performances supérieures pour la détection d’objets sur dispositifs mobiles. Nos modèles offrent un meilleur compromis entre précision et latence par rapport à d’autres modèles populaires. PicoDet-S, avec seulement 0,99 million de paramètres, atteint 30,6 % de mAP, soit une amélioration absolue de 4,8 % en mAP, tout en réduisant la latence d’inférence sur CPU mobile de 55 % par rapport à YOLOX-Nano, et une amélioration absolue de 7,1 % en mAP par rapport à NanoDet. Il atteint 123 FPS (150 FPS avec Paddle Lite) sur CPU ARM mobile pour une taille d’entrée de 320. PicoDet-L, avec seulement 3,3 millions de paramètres, atteint 40,9 % de mAP, soit une amélioration absolue de 3,7 % en mAP et une vitesse 44 % supérieure à celle de YOLOv5s. Comme illustré à la figure 1, nos modèles surpassent largement les résultats les plus récents dans le domaine de la détection d’objets légère. Le code source et les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/PaddlePaddle/PaddleDetection.

PP-PicoDet : Un détecteur d'objets en temps réel amélioré pour les appareils mobiles | Articles de recherche récents | HyperAI