HyperAIHyperAI
il y a 2 mois

Recherche de MobileNetV3

Howard, Andrew ; Sandler, Mark ; Chu, Grace ; Chen, Liang-Chieh ; Chen, Bo ; Tan, Mingxing ; Wang, Weijun ; Zhu, Yukun ; Pang, Ruoming ; Vasudevan, Vijay ; Le, Quoc V. ; Adam, Hartwig
Recherche de MobileNetV3
Résumé

Nous présentons la prochaine génération de MobileNets basée sur une combinaison de techniques de recherche complémentaires ainsi qu'une nouvelle conception d'architecture. MobileNetV3 est optimisé pour les processeurs des téléphones mobiles grâce à une combinaison de la recherche d'architecture de réseau sensible au matériel (NAS) complétée par l'algorithme NetAdapt, puis amélioré ultérieurement grâce à des avancées architecturales novatrices. Cet article marque le début de l'exploration de la façon dont les algorithmes de recherche automatisés et la conception de réseaux peuvent travailler ensemble pour exploiter des approches complémentaires, améliorant ainsi l'état de l'art global. À travers ce processus, nous créons deux nouveaux modèles MobileNet pour publication : MobileNetV3-Large et MobileNetV3-Small, destinés respectivement aux cas d'utilisation à ressources élevées et faibles. Ces modèles sont ensuite adaptés et appliqués aux tâches de détection d'objets et de segmentation sémantique. Pour la tâche de segmentation sémantique (ou toute prédiction dense par pixel), nous proposons un nouveau décodeur de segmentation efficace Lite Reduced Atrous Spatial Pyramid Pooling (LR-ASPP). Nous obtenons des résultats inédits dans l'état de l'art pour la classification, la détection et la segmentation mobiles. MobileNetV3-Large est 3,2 % plus précis sur la classification ImageNet tout en réduisant le temps d'exécution (latency) de 15 % par rapport à MobileNetV2. MobileNetV3-Small est 4,6 % plus précis tout en réduisant le temps d'exécution (latency) de 5 % par rapport à MobileNetV2. La détection avec MobileNetV3-Large est 25 % plus rapide avec une précision similaire à celle de MobileNetV2 sur la détection COCO. Le modèle MobileNetV3-Large LR-ASPP est 30 % plus rapide que le modèle MobileNetV2 R-ASPP avec une précision similaire pour la segmentation Cityscapes.