Regroupement par convolution pour l'apprentissage non supervisé

La tâche de l'étiquetage des données pour l'entraînement des réseaux neuronaux profonds est ardue et fastidieuse, nécessitant des millions d'étiquettes pour atteindre les résultats actuels de pointe. Une telle dépendance à de grandes quantités de données étiquetées peut être atténuée en exploitant des caractéristiques hiérarchiques grâce à des techniques d'apprentissage non supervisé. Dans ce travail, nous proposons d'entraîner un réseau neuronal convolutif profond basé sur une version améliorée de l'algorithme de clustering k-means, qui réduit le nombre de paramètres corrélés sous la forme de filtres similaires, et augmente ainsi la précision de classification lors des tests. Nous appelons notre algorithme le clustering k-means convolutif. Nous montrons également que l'apprentissage des connexions entre les couches d'un réseau neuronal convolutif profond améliore sa capacité à être entraîné avec une quantité moindre de données étiquetées. Nos expériences montrent que l'algorithme proposé surpasse les autres techniques qui apprennent les filtres de manière non supervisée. Plus précisément, nous avons obtenu une précision de test de 74,1% sur STL-10 et une erreur de test de 0,5% sur MNIST.