HyperAIHyperAI
il y a 17 jours

YOLO-Former : YOLO S'Empare du ViT

Javad Khoramdel, Ahmad Moori, Yasamin Borhani, Armin Ghanbarzadeh, Esmaeil Najafi
YOLO-Former : YOLO S'Empare du ViT
Résumé

La méthode proposée YOLO-Former intègre de manière fluide les concepts des transformateurs et de YOLOv4 afin de concevoir un système de détection d'objets à la fois hautement précis et efficace. Cette approche exploite la vitesse de déduction rapide de YOLOv4 tout en tirant parti des avantages de l'architecture des transformateurs grâce à l'intégration de modules d'attention convolutive et de transformateurs. Les résultats démontrent l'efficacité de la méthode proposée, atteignant une précision moyenne en moyenne (mAP) de 85,76 % sur le jeu de données Pascal VOC, tout en maintenant une vitesse de prédiction élevée, avec un taux de 10,85 images par seconde. La contribution de ce travail réside dans la démonstration de la manière dont la combinaison innovante de ces deux techniques de pointe peut conduire à des améliorations supplémentaires dans le domaine de la détection d'objets.

YOLO-Former : YOLO S'Empare du ViT | Articles de recherche récents | HyperAI