Du flou au brillant : détection d'objets aériens basée sur YOLOv5 avec super-résolution

La demande croissante de détection d’objets précise dans les images aériennes s’est intensifiée avec l’essor des drones et des technologies satellitaires. Les modèles traditionnels de détection d’objets, entraînés sur des jeux de données biaisés en faveur des objets de grande taille, peinent à atteindre des performances optimales dans les scénarios aériens où les objets petits et fortement regroupés sont fréquents. Pour relever ce défi, nous proposons une approche innovante combinant la super-résolution et une architecture légère adaptée de YOLOv5. Nous avons évalué les performances de notre modèle sur plusieurs jeux de données, notamment VisDrone-2023, SeaDroneSee, VEDAI et NWPU VHR-10. L’architecture Super Resolved YOLOv5 intègre des blocs d’encodeurs Transformer, permettant au modèle de capturer des informations contextuelles globales, ce qui améliore significativement les résultats de détection, notamment dans des conditions de forte densité et d’occlusion. Ce modèle léger offre non seulement une précision accrue, mais aussi une utilisation efficace des ressources, le rendant particulièrement adapté aux applications en temps réel. Nos résultats expérimentaux démontrent une performance supérieure dans la détection d’objets petits et fortement regroupés, soulignant l’importance du choix du jeu de données et de l’adaptation architecturale pour cette tâche spécifique. En particulier, notre méthode atteint un mAP de 52,5 % sur VisDrone, dépassant ainsi les meilleures approches antérieures. Cette approche s’annonce prometteuse pour faire progresser considérablement la détection d’objets dans les images aériennes, contribuant à des résultats plus précis et fiables dans diverses applications réelles.