HyperAIHyperAI
il y a 2 mois

Supervision avec Étiquettes Partielles pour l'Apprentissage Génératif de Labels Bruyants Agnostiques

Fengbei Liu; Chong Wang; Yuanhong Chen; Yuyuan Liu; Gustavo Carneiro
Supervision avec Étiquettes Partielles pour l'Apprentissage Génératif de Labels Bruyants Agnostiques
Résumé

L'apprentissage des étiquettes bruyantes a été abordé à la fois par des approches discriminatives et génératives. Bien que les méthodes discriminatives soient simples et efficaces, les modèles génératifs offrent une manière plus fondée de dissocier les étiquettes propres des étiquettes bruyantes et d'estimer la matrice de transition des étiquettes. Cependant, les méthodes génératives existantes nécessitent souvent l'inférence de variables latentes supplémentaires via des modules génératifs coûteux ou des hypothèses heuristiques, ce qui entrave l'optimisation adaptative pour différentes directions causales. Elles supposent également une priorité uniforme sur les étiquettes propres, ce qui ne reflète pas la distribution propre aux échantillons et l'incertitude associée. Dans cet article, nous proposons un nouveau cadre pour l'apprentissage génératif des étiquettes bruyantes qui répond à ces défis. Premièrement, nous introduisons une nouvelle optimisation en une seule étape qui approxime directement la génération d'images par la sortie d'un classifieur discriminatif. Cette approximation réduit considérablement le coût de calcul de la génération d'images, préserve les avantages du modèle génératif et permet à notre cadre d'être agnostique face à différents scénarios de causalité (c'est-à-dire, l'image génère l'étiquette ou vice versa). Deuxièmement, nous présentons une nouvelle supervision par Étiquetage Partiel (PLS) pour l'apprentissage des étiquettes bruyantes qui prend en compte à la fois la couverture des étiquettes propres et leur incertitude. La supervision PLS ne vise pas seulement à minimiser la perte, mais cherche également à capturer la distribution propre aux échantillons et l'incertitude sous-jacentes des étiquettes propres. Des expériences approfondies sur des benchmarks en vision par ordinateur et en traitement du langage naturel (NLP) montrent que notre modèle génératif atteint des résultats de pointe tout en réduisant considérablement le coût de calcul. Notre code est disponible sur https://github.com/lfb-1/GNL.