Apprentissage non supervisé utilisant un CNN pré-entraîné et une banque de mémoire associative

Les caractéristiques de convolution profonde extraites d'un ensemble de données étiquetées complet contiennent des représentations substantielles qui peuvent être utilisées efficacement dans un nouveau domaine. Bien que les caractéristiques génériques aient obtenu de bons résultats dans de nombreuses tâches visuelles, un ajustement fin est nécessaire pour que les modèles CNN pré-entraînés soient plus performants et offrent des résultats à la pointe de l'art. L'ajustement fin effectué à l'aide de l'algorithme de rétropropagation dans un cadre supervisé est une procédure consommatrice de temps et de ressources. Dans cet article, nous présentons une nouvelle architecture et une approche pour la reconnaissance d'objets non supervisée qui résout le problème mentionné ci-dessus lié à l'ajustement fin des approches d'apprentissage profond supervisées basées sur des CNN, tout en permettant l'extraction automatique de caractéristiques. Contrairement aux travaux existants, notre approche s'applique aux tâches générales de reconnaissance d'objets. Elle utilise un modèle CNN pré-entraîné (sur un domaine connexe) pour l'extraction automatique de caractéristiques, couplée à une banque mémoire associative basée sur un réseau de Hopfield pour stocker les motifs destinés à la classification. L'utilisation d'une banque mémoire associative dans notre cadre permet d'éliminer la rétropropagation tout en offrant des performances compétitives sur un ensemble de données inconnu.