HyperAIHyperAI
il y a 3 mois

YOLOv12 : Analyse des principales caractéristiques architecturales

Mujadded Al Rabbani Alif, Muhammad Hussain
YOLOv12 : Analyse des principales caractéristiques architecturales
Résumé

Ce papier présente une analyse architecturale de YOLOv12, une avancée significative dans le domaine de la détection d’objets en temps réel à une seule étape, qui s’appuie sur les forces de ses prédécesseurs tout en introduisant des améliorations clés. Le modèle intègre un arrière-plan optimisé (R-ELAN), des convolutions séparables de taille 7×7 ainsi qu’un mécanisme d’attention basé sur la région piloté par FlashAttention, ce qui améliore l’extraction de caractéristiques, renforce l’efficacité et assure des détections plus robustes. Grâce à plusieurs variantes modélaires, similaires à celles de ses prédécesseurs, YOLOv12 offre des solutions évolutives adaptées aussi bien aux applications sensibles au délai qu’aux cas exigeant une haute précision. Les résultats expérimentaux montrent des gains constants en précision moyenne (mAP) et en vitesse d’inférence, ce qui en fait un choix particulièrement attrayant pour des applications dans les systèmes autonomes, la sécurité et l’analyse en temps réel. En atteignant un équilibre optimal entre efficacité computationnelle et performance, YOLOv12 établit une nouvelle référence dans le domaine de la vision par ordinateur en temps réel, facilitant ainsi son déploiement sur une large gamme de plateformes matérielles, allant des dispositifs embarqués aux grappes haute performance.