HyperAIHyperAI
il y a 11 jours

DP-SSL : Vers un apprentissage semi-supervisé robuste avec un petit nombre d’échantillons étiquetés

Yi Xu, Jiandong Ding, Lu Zhang, Shuigeng Zhou
DP-SSL : Vers un apprentissage semi-supervisé robuste avec un petit nombre d’échantillons étiquetés
Résumé

La rareté des données étiquetées constitue un obstacle majeur au développement du deep learning. L’apprentissage semi-supervisé (SSL) offre une voie prometteuse pour exploiter les données non étiquetées grâce à l’attribution de pseudo-étiquettes. Toutefois, lorsque le nombre de données étiquetées est très faible (par exemple quelques échantillons étiquetés par classe), les performances du SSL sont médiocres et instables, probablement en raison de la faible qualité des pseudo-étiquettes apprises. Dans ce travail, nous proposons une nouvelle méthode SSL appelée DP-SSL, qui adopte un schéma innovant de programmation de données (DP) pour générer des étiquettes probabilistes pour les données non étiquetées. Contrairement aux méthodes DP existantes qui dépendent d’experts humains pour fournir des fonctions d’étiquetage initiales (LFs), nous développons une approche basée sur l’apprentissage par choix multiple (MCL) afin de générer automatiquement des LFs dès le départ dans un cadre SSL. En utilisant les étiquettes bruitées produites par ces LFs, nous concevons un modèle d’étiquetage pour résoudre les conflits et les chevauchements entre ces étiquettes bruyantes, puis inférons finalement des étiquettes probabilistes pour les échantillons non étiquetés. Des expériences étendues sur quatre benchmarks standards de SSL montrent que DP-SSL parvient à fournir des étiquettes fiables pour les données non étiquetées et à atteindre de meilleures performances de classification sur les ensembles de test par rapport aux méthodes SSL existantes, en particulier lorsque le nombre de données étiquetées est faible. Plus précisément, sur CIFAR-10 avec seulement 40 échantillons étiquetés, DP-SSL atteint une précision d’annotation de 93,82 % sur les données non étiquetées et une précision de classification de 93,46 % sur les données de test, dépassant ainsi les résultats de l’état de l’art.

DP-SSL : Vers un apprentissage semi-supervisé robuste avec un petit nombre d’échantillons étiquetés | Articles de recherche récents | HyperAI