HyperAIHyperAI
il y a 17 jours

YOLOv4 : Vitesse optimale et précision détection d'objets

Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
YOLOv4 : Vitesse optimale et précision détection d'objets
Résumé

Un grand nombre de caractéristiques ont été proposées afin d'améliorer la précision des réseaux de neurones convolutifs (CNN). Une évaluation expérimentale systématique de combinaisons de ces caractéristiques sur de grandes bases de données, ainsi qu'une justification théorique de leurs effets, s'imposent. Certaines de ces caractéristiques ne s'appliquent qu'à des modèles spécifiques, pour des problèmes particuliers, ou uniquement à des jeux de données de petite taille ; en revanche, d'autres, telles que la normalisation par lot (batch-normalization) et les connexions résiduelles (residual-connections), s'avèrent pertinentes pour la majorité des modèles, des tâches et des jeux de données. Nous supposons que des caractéristiques universellement applicables incluent les connexions résiduelles pondérées (Weighted-Residual-Connections, WRC), les connexions partielles à travers les étages (Cross-Stage-Partial connections, CSP), la normalisation par lot croisée (Cross mini-Batch Normalization, CmBN), l'entraînement auto-adversaire (Self-adversarial-training, SAT) et l'activation Mish. Nous introduisons ici de nouvelles caractéristiques : WRC, CSP, CmBN, SAT, activation Mish, augmentation de données Mosaic, régularisation DropBlock, et perte CIoU, que nous combinons de manière stratégique pour atteindre des résultats de pointe : 43,5 % de précision moyenne (AP) et 65,7 % d'AP50 sur le jeu de données MS COCO, à une vitesse en temps réel d'environ 65 FPS sur une Tesla V100. Le code source est disponible à l'adresse suivante : https://github.com/AlexeyAB/darknet