HyperAIHyperAI
il y a 17 jours

Modèles de diffusion augmentés par récupération d'étiquettes pour l'apprentissage à partir d'étiquettes bruitées

Jian Chen, Ruiyi Zhang, Tong Yu, Rohan Sharma, Zhiqiang Xu, Tong Sun, Changyou Chen
Modèles de diffusion augmentés par récupération d'étiquettes pour l'apprentissage à partir d'étiquettes bruitées
Résumé

L’apprentissage à partir d’étiquettes bruitées constitue un problème important et ancien en apprentissage automatique pour les applications réelles. L’une des principales lignes de recherche se concentre sur l’apprentissage d’un correcteur d’étiquettes afin de purifier les étiquettes potentiellement bruitées. Toutefois, ces méthodes reposent généralement sur des hypothèses strictes et sont limitées à certains types de bruit d’étiquettes. Dans cet article, nous reformulons le problème du bruit d’étiquettes sous l’angle d’un modèle génératif, c’est-à-dire que les étiquettes sont générées par une révision progressive d’une estimation aléatoire initiale. Cette nouvelle perspective permet immédiatement aux modèles diffusion puissants existants d’apprendre de manière fluide le processus génératif stochastique. Une fois l’incertitude générative modélisée, nous pouvons effectuer l’inférence de classification par estimation du maximum de vraisemblance des étiquettes. Pour atténuer l’impact des étiquettes bruitées, nous proposons le modèle diffusion Label-Retrieval-Augmented (LRA), qui exploite la cohérence des voisins afin de construire efficacement des étiquettes pseudo-propres pour l’entraînement du modèle diffusion. Notre modèle est flexible et général, permettant une intégration aisée d’informations conditionnelles diverses, par exemple l’utilisation de modèles pré-entraînés, pour encore améliorer les performances. Des expériences étendues sont menées afin d’évaluer notre approche. Notre modèle atteint de nouveaux résultats d’état de l’art (SOTA) sur tous les jeux de données standards du monde réel. Notamment, en intégrant des informations conditionnelles provenant du puissant modèle CLIP, notre méthode permet d’augmenter l’exactitude actuelle d’état de l’art de 10 à 20 points absolus dans de nombreux cas.

Modèles de diffusion augmentés par récupération d'étiquettes pour l'apprentissage à partir d'étiquettes bruitées | Articles de recherche récents | HyperAI