CleanNet : Apprentissage par transfert pour l'entraînement d'un classifieur d'images à grande échelle avec bruit de label

Dans cet article, nous étudions le problème d'apprentissage de modèles de classification d'images en présence de bruit dans les étiquettes. Les approches existantes qui dépendent de la supervision humaine ne sont généralement pas évolutives, car l'identification manuelle des étiquettes correctes ou incorrectes est très chronophage. En revanche, les approches qui ne reposent pas sur la supervision humaine sont plus évolutives mais moins efficaces. Pour réduire la quantité de supervision humaine nécessaire au nettoyage du bruit dans les étiquettes, nous introduisons CleanNet, un réseau neuronal d'embedding conjoint, qui n'exige qu'une fraction des classes soit vérifiée manuellement pour fournir une connaissance du bruit dans les étiquettes pouvant être transférée à d'autres classes. Nous intégrons ensuite CleanNet et un classificateur neuronal convolutif conventionnel dans un cadre unique pour l'apprentissage de la classification d'images. Nous démontrons l'efficacité de l'algorithme proposé tant pour la tâche de détection du bruit dans les étiquettes que pour la tâche de classification d'images sur des données bruyantes, sur plusieurs jeux de données à grande échelle. Les résultats expérimentaux montrent que CleanNet peut réduire le taux d'erreur de détection du bruit dans les étiquettes des classes non supervisées (classes réservées) de 41,5 % par rapport aux méthodes actuelles faiblement supervisées. Il atteint également 47 % du gain de performance obtenu en vérifiant toutes les images avec seulement 3,2 % des images vérifiées lors d'une tâche de classification d'images. Le code source et le jeu de données seront disponibles sur kuanghuei.github.io/CleanNetProject.