LogoDet-3K : Un grand jeu de données d’images pour la détection de logos

La détection de logos connaît un intérêt croissant en raison de ses nombreuses applications dans le domaine multimédia, telles que la détection de violations de droits d’auteur, la surveillance de la visibilité des marques ou encore la gestion des marques produits sur les réseaux sociaux. Dans cet article, nous introduisons LogoDet-3K, le plus grand ensemble de données pour la détection de logos doté d’annotations complètes, comprenant 3 000 catégories de logos, environ 200 000 objets de logos annotés manuellement et 158 652 images. LogoDet-3K établit un défi plus exigeant pour la détection de logos grâce à une couverture plus complète et une diversité plus grande, tant en termes de catégories de logos que d’objets annotés, par rapport aux ensembles de données existants. Nous décrivons le processus de collecte et d’annotation de notre jeu de données, et analysons son échelle et sa diversité en comparaison avec d’autres jeux de données dédiés à la détection de logos. Par ailleurs, nous proposons une méthode de référence robuste, Logo-Yolo, qui intègre la perte Focal et la perte CIoU dans le cadre d’état de l’art YOLOv3 afin de traiter la détection à grande échelle de logos. Logo-Yolo permet de résoudre efficacement les problèmes liés aux objets de différentes échelles, au déséquilibre des échantillons de logos et à la régression incohérente des boîtes englobantes. Elle améliore de près de 4 % les performances moyennes par rapport à YOLOv3, et obtient des gains supérieurs par rapport à plusieurs modèles profonds rapportés sur LogoDet-3K. Les évaluations effectuées sur trois autres jeux de données existants confirment également l’efficacité de notre méthode, tout en démontrant une meilleure capacité de généralisation de LogoDet-3K sur les tâches de détection et de recherche de logos. L’ensemble de données LogoDet-3K est mis à disposition pour favoriser la recherche à grande échelle sur les logos et est accessible à l’adresse suivante : https://github.com/Wangjing1551/LogoDet-3K-Dataset.