YOLOv6 : Un cadre de détection d'objets à une étape pour les applications industrielles

Depuis de nombreuses années, la série YOLO s’est imposée comme la norme industrielle de référence pour la détection d’objets efficace. La communauté YOLO a connu une croissance fulgurante, enrichissant ainsi son application sur une multitude de plateformes matérielles et dans diverses scénarios. Dans ce rapport technique, nous nous efforçons de repousser les limites de cette approche vers un nouveau niveau, avec une détermination inébranlable tournée vers les applications industrielles.Étant donné les exigences variées en termes de vitesse et de précision dans les environnements réels, nous avons mené une analyse approfondie des avancées récentes en détection d’objets, provenant aussi bien du secteur industriel que du milieu académique. Plus précisément, nous avons intégré de manière significative des idées issues des dernières architectures de réseaux, des stratégies d’entraînement, des techniques de test, de la quantification et des méthodes d’optimisation. En s’appuyant sur ces fondations, nous avons combiné nos propres réflexions et expériences pour concevoir une gamme de réseaux prêts au déploiement, disponibles à différentes échelles afin de répondre à des cas d’usage diversifiés. Avec l’aimable autorisation des auteurs originaux de YOLO, nous avons baptisé ce nouveau modèle YOLOv6. Nous adressons chaleureusement un appel aux utilisateurs et contributeurs pour participer à son amélioration continue. Pour une idée de ses performances, YOLOv6-N atteint 35,9 % d’AP sur le jeu de données COCO à un débit de 1234 FPS sur une GPU NVIDIA Tesla T4. YOLOv6-S réalise 43,5 % d’AP à 495 FPS, surpassant ainsi d’autres détecteurs principaux de taille similaire (YOLOv5-S, YOLOX-S et PPYOLOE-S). La version quantifiée de YOLOv6-S atteint même un nouveau record d’état de l’art avec 43,3 % d’AP à 869 FPS. Par ailleurs, les versions YOLOv6-M et YOLOv6-L obtiennent également une meilleure précision (respectivement 49,5 % et 52,3 %) que d’autres détecteurs pour une vitesse d’inférence comparable. Nous avons mené des expériences soigneusement planifiées afin de valider l’efficacité de chaque composant. Le code source est disponible à l’adresse suivante : https://github.com/meituan/YOLOv6.