Déploiement En Un Clic De YOLOv12
🚀 YOLOv12 : Un choix polyvalent pour les tâches de vision par ordinateur, avec à la fois vitesse et précision à leur apogée ! 🚀

Ce tutoriel utilise RTX 4090 comme ressource de calcul.
1. Introduction au tutoriel 📖
YOLOv12 a été lancé en 2025 par des chercheurs de l'Université de Buffalo et de l'Université de l'Académie chinoise des sciences.YOLOv12 : Détecteurs d'objets en temps réel centrés sur l'attention".
Depuis longtemps, l’amélioration de l’architecture réseau du framework YOLO est un sujet central dans le domaine de la vision par ordinateur. Bien que le mécanisme d’attention excelle dans les capacités de modélisation, les améliorations basées sur le CNN sont toujours courantes car les modèles basés sur l’attention sont difficiles à égaler en termes de vitesse. Cependant, l’introduction de YOLOv12 a changé cette situation ! Non seulement il est comparable aux frameworks basés sur CNN en termes de vitesse, mais il exploite également pleinement les avantages de performance du mécanisme d'attention, devenant une nouvelle référence pour la détection d'objets en temps réel.
Les performances révolutionnaires de YOLOv12
- YOLOv12-N atteint un mAP de 40,6% avec une latence d'inférence de 1,64 millisecondes sur un GPU T4, soit 2,1%/1,2% de plus que YOLOv10-N/YOLOv11-N.
- YOLOv12-S bat RT-DETR-R18 / RT-DETRv2-R18, exécutant 42% plus rapidement, utilisant seulement 36% de calcul et réduisant les paramètres de 45%.
📜 Historique du développement de YOLO et tutoriels associés
YOLO (You Only Look Once) est un leader dans la détection d'objets et la segmentation d'images depuis son lancement en 2015. Voici l'évolution de la série YOLO :
- YOLOv2 (2016): Présentation de la normalisation par lots, des boîtes d'ancrage et du clustering de dimensions.
- YOLOv3 (2018):Utiliser des réseaux dorsaux plus efficaces, des multi-ancres et un regroupement pyramidal spatial.
- YOLOv4 (2020): Présentation de l'augmentation des données Mosaic, de la tête de détection sans ancrage et de la nouvelle fonction de perte. → Tutoriel :DeepSOCIAL réalise une surveillance de la distance de foule basée sur YOLOv4 et trie le suivi multi-cibles
- YOLOv5: Ajout de l'optimisation des hyperparamètres, du suivi des expériences et des fonctions d'exportation automatique. → Tutoriel :Modèle de suivi multi-cibles en temps réel YOLOv5_deepsort
- YOLOv6 (2022): Meituan open source, largement utilisé dans les robots de livraison autonomes.
- YOLOv7: Prend en charge l'estimation de la pose pour l'ensemble de données de points clés COCO.
- YOLOv8 (2023):Ultralytics est publié, prenant en charge une gamme complète de tâches d'IA visuelle.
- YOLOv9:Présentation des informations de gradient programmables (PGI) et du réseau d'agrégation de couches efficace généralisé (GELAN).
- YOLOv10:Lancé par l'Université Tsinghua, il introduit un en-tête de bout en bout et élimine l'exigence de suppression non maximale (NMS). → Tutoriel :Détection d'objets de bout en bout en temps réel YOLOv10
- YOLOv11:Le dernier modèle d'Ultralytics, prenant en charge la détection, la segmentation, l'estimation de la pose, le suivi et la classification. → Tutoriel :Déploiement en un clic de YOLOv11
- YOLOv12 🚀 NOUVEAU:Les doubles pics de vitesse et de précision, combinés aux avantages de performance du mécanisme d'attention !
2. Étapes de fonctionnement🛠️
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
La sortie d'un détecteur d'objets est un ensemble de cadres de délimitation entourant les objets de l'image, ainsi qu'une étiquette de classe et un score de confiance pour chaque cadre de délimitation. La détection d'objets est un bon choix si vous devez identifier des objets intéressants dans une scène mais que vous n'avez pas besoin de connaître leur emplacement ou leur forme exacts.
Il est divisé en deux fonctions suivantes :
- Détection d'images
- Détection vidéo
2. Détection d'images
L'entrée est une image et la sortie est une image avec une étiquette.


Figure 1 Détection d'image
3. Détection vidéo
L'entrée est une vidéo et la sortie est une vidéo avec des étiquettes.

Figure 2 Détection vidéo
🤝 Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

YOLOv12 n’est pas seulement un saut technologique, mais aussi une révolution dans le domaine de la vision par ordinateur ! Venez le découvrir ! 🚀