Apprentissage Profond pour la Reconnaissance de Logos

Dans cet article, nous proposons une méthode de reconnaissance de logos utilisant l'apprentissage profond.Notre pipeline de reconnaissance est composé d'une proposition de région de logo suivie d'unRéseau neuronal convolutif (CNN) spécifiquement entraîné pour la classification des logos, même s'ils ne sont pas précisément localisés. Des expériences sontmenées sur la base de données FlickrLogos-32, et nous évaluons l'effet sur les performances de reconnaissance de l'augmentation des données synthétiques par rapport aux données réelles, ainsi que du pré-traitement des images. De plus, nous examinons systématiquement les avantagesde différents choix d'entraînement tels que l'équilibrage des classes, le pondérage des échantillons et la modélisation explicite de la classe arrière-plan (c'est-à-dire les régions sans logo). Les résultats expérimentaux confirment la faisabilité de la méthode proposée, qui surpassent les méthodes actuelles de l'état de l'art.