HyperAIHyperAI
il y a 2 mois

YOLOv11 : Aperçu des principales améliorations architecturales

Rahima Khanam; Muhammad Hussain
YOLOv11 : Aperçu des principales améliorations architecturales
Résumé

Cette étude présente une analyse architecturale de YOLOv11, la dernière itération de la série de modèles de détection d'objets YOLO (You Only Look Once). Nous examinons les innovations architecturales du modèle, notamment l'introduction du bloc C3k2 (Cross Stage Partial avec taille de noyau 2), du composant SPPF (Spatial Pyramid Pooling - Fast) et du module C2PSA (bloc convolutif avec attention spatiale parallèle), qui contribuent à améliorer les performances du modèle de plusieurs manières, telles qu'une extraction de caractéristiques améliorée. Le document explore les capacités élargies de YOLOv11 dans diverses tâches de vision par ordinateur, y compris la détection d'objets, le segmention d'instances, l'estimation de pose et la détection d'objets orientés (OBB). Nous passons en revue les améliorations des performances du modèle en termes de précision moyenne (mAP) et d'efficacité computationnelle par rapport à ses prédécesseurs, en mettant l'accent sur le compromis entre le nombre de paramètres et la précision. De plus, cette étude discute de la polyvalence de YOLOv11 dans différentes tailles de modèles, allant du nano au extra-large, pour répondre aux besoins variés des applications, des dispositifs périphériques aux environnements informatiques haute performance. Notre recherche fournit des perspectives sur la position de YOLOv11 dans le paysage plus large de la détection d'objets et son potentiel impact sur les applications en temps réel en vision par ordinateur.