SeqNet : Réseaux séquentiels pour la reconnaissance d’objets de signalisation routière à une seule tentative avec apprentissage par transfert
Dans les tâches de reconnaissance de panneaux routiers, la capacité à reconnaître des panneaux en se basant sur des images de référence synthétiques constitue une aptitude humaine qui peut être réalisée par des algorithmes d’apprentissage à une seule exemple (one-shot learning). La reconnaissance d’objets à une seule exemple représente un défi majeur pour les réseaux neuronaux profonds, où un modèle profond doit classifier des exemples de requête à partir d’images de soutien. Ce défi devient encore plus complexe lorsque se produit un décalage de domaine entre les échantillons de soutien et ceux de requête. La généralisation d’un modèle profond à un domaine inconnu présentant une distribution différente constitue une autre difficulté majeure dans le cadre de la reconnaissance à une seule exemple. Ce travail présente un nouveau réseau profond appelé SeqNet, conçu pour surmonter ces problèmes. À notre connaissance, ce travail surpasser toutes les architectures d’état de l’art dans les tâches de reconnaissance de panneaux routiers à une seule exemple et d’identification de logos à une seule exemple, grâce à des résultats supérieurs. Le modèle SeqNet proposé parvient à généraliser à des domaines inconnus sans nécessiter de fine-tuning supplémentaire sur les données de test. Nous démontrons également comment l’utilisation de connaissances transférées provenant d’un domaine étranger mais vaste permet de réduire le nombre de paramètres du réseau, entraînant ainsi une réduction significative de la taille du modèle. Grâce à l’exploitation du pouvoir des connaissances transférées issues d’un grand modèle profond, SeqNet devient plus compact, avec environ six fois moins de paramètres que ses concurrents. La taille réduite de l’architecture SeqNet permet son déploiement sur des dispositifs à ressources limitées, notamment dans des applications telles que les véhicules intelligents. Les résultats expérimentaux montrent que la performance de SeqNet est nettement améliorée, avec une augmentation allant jusqu’à 20 % en précision pour la classification à une seule exemple, et jusqu’à 30 % en surface sous la courbe (AUC) pour les tâches de recherche d’images.