HyperAIHyperAI
il y a 8 jours

Apprentissage avec un bruit d'étiquettes dépendant des caractéristiques : une approche progressive

Yikai Zhang, Songzhu Zheng, Pengxiang Wu, Mayank Goswami, Chao Chen
Apprentissage avec un bruit d'étiquettes dépendant des caractéristiques : une approche progressive
Résumé

Le bruit d’étiquettes est fréquemment observé dans les grands ensembles de données du monde réel. Ce bruit est introduit pour diverses raisons ; il est hétérogène et dépendant des caractéristiques. La plupart des approches existantes pour traiter les étiquettes bruitées se divisent en deux catégories : elles supposent soit un bruit idéal indépendant des caractéristiques, soit restent heuristiques sans garanties théoriques. Dans cet article, nous proposons de cibler une nouvelle famille de bruit d’étiquettes dépendant des caractéristiques, qui est bien plus générale que le bruit d’étiquettes i.i.d. couramment utilisé et englobe un large éventail de motifs de bruit. En nous concentrant sur cette famille générale de bruit, nous proposons un algorithme progressif de correction d’étiquettes, qui corrige itérativement les étiquettes et affine progressivement le modèle. Nous fournissons des garanties théoriques démontrant que, pour une grande variété de motifs de bruit (inconnus), un classificateur entraîné selon cette stratégie converge vers une solution consistante avec le classificateur de Bayes. En expériences, notre méthode surpasser les meilleures approches existantes (SOTA) et s’avère robuste face à divers types et niveaux de bruit.

Apprentissage avec un bruit d'étiquettes dépendant des caractéristiques : une approche progressive | Articles de recherche récents | HyperAI