HyperAIHyperAI

Command Palette

Search for a command to run...

DP-SSL : Vers un apprentissage semi-supervisé robuste avec un petit nombre d’échantillons étiquetés

Yi Xu Jiandong Ding Lu Zhang Shuigeng Zhou

Résumé

La rareté des données étiquetées constitue un obstacle majeur au développement du deep learning. L’apprentissage semi-supervisé (SSL) offre une voie prometteuse pour exploiter les données non étiquetées grâce à l’attribution de pseudo-étiquettes. Toutefois, lorsque le nombre de données étiquetées est très faible (par exemple quelques échantillons étiquetés par classe), les performances du SSL sont médiocres et instables, probablement en raison de la faible qualité des pseudo-étiquettes apprises. Dans ce travail, nous proposons une nouvelle méthode SSL appelée DP-SSL, qui adopte un schéma innovant de programmation de données (DP) pour générer des étiquettes probabilistes pour les données non étiquetées. Contrairement aux méthodes DP existantes qui dépendent d’experts humains pour fournir des fonctions d’étiquetage initiales (LFs), nous développons une approche basée sur l’apprentissage par choix multiple (MCL) afin de générer automatiquement des LFs dès le départ dans un cadre SSL. En utilisant les étiquettes bruitées produites par ces LFs, nous concevons un modèle d’étiquetage pour résoudre les conflits et les chevauchements entre ces étiquettes bruyantes, puis inférons finalement des étiquettes probabilistes pour les échantillons non étiquetés. Des expériences étendues sur quatre benchmarks standards de SSL montrent que DP-SSL parvient à fournir des étiquettes fiables pour les données non étiquetées et à atteindre de meilleures performances de classification sur les ensembles de test par rapport aux méthodes SSL existantes, en particulier lorsque le nombre de données étiquetées est faible. Plus précisément, sur CIFAR-10 avec seulement 40 échantillons étiquetés, DP-SSL atteint une précision d’annotation de 93,82 % sur les données non étiquetées et une précision de classification de 93,46 % sur les données de test, dépassant ainsi les résultats de l’état de l’art.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DP-SSL : Vers un apprentissage semi-supervisé robuste avec un petit nombre d’échantillons étiquetés | Articles | HyperAI