HyperAIHyperAI

Command Palette

Search for a command to run...

ProMix : Lutte contre le bruit d'étiquetage par la maximisation de l'utilité des échantillons propres

Ruixuan Xiao Yiwen Dong Haobo Wang Lei Feng Runze Wu Gang Chen Junbo Zhao

Résumé

L’apprentissage avec des étiquettes bruitées (LNL) est devenu un sujet particulièrement attractif, car les données malannotées sont relativement moins coûteuses à obtenir. Les approches les plus récentes et les plus performantes emploient des mécanismes de sélection spécifiques pour distinguer les échantillons propres des échantillons bruités, puis appliquent des techniques d’apprentissage semi-supervisé (SSL) afin d’améliorer les performances. Toutefois, l’étape de sélection fournit généralement un sous-ensemble propre de taille modérée et de qualité satisfaisante, négligeant ainsi un grand nombre d’échantillons propres potentiellement exploitables. Pour combler cette lacune, nous proposons un nouveau cadre LNL, nommé ProMix, qui vise à maximiser l’utilité des échantillons propres afin d’améliorer significativement les performances. La pierre angulaire de notre méthode est une technique de sélection à haute confiance par correspondance, qui sélectionne les exemples présentant des scores de confiance élevés et des prédictions conformes aux étiquettes fournies, afin d’élargir dynamiquement un ensemble de base d’échantillons propres. Afin de contrer les effets indésirables liés à une sélection excessive de l’ensemble propre, nous avons également conçu un nouveau cadre SSL capable d’entraîner des classifieurs équilibrés et non biaisés sur les échantillons propres et bruités séparés. Des expériences étendues montrent que ProMix améliore significativement les résultats actuels de l’état de l’art sur plusieurs benchmarks, avec différents types et niveaux de bruit. Il obtient une amélioration moyenne de 2,48 % sur le jeu de données CIFAR-N. Le code source est disponible à l’adresse suivante : https://github.com/Justherozen/ProMix


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
ProMix : Lutte contre le bruit d'étiquetage par la maximisation de l'utilité des échantillons propres | Articles | HyperAI