HyperAIHyperAI
il y a 8 jours

Apprentissage des étiquettes bruitées dépendantes de l’instance par modélisation graphique

Arpit Garg, Cuong Nguyen, Rafael Felix, Thanh-Toan Do, Gustavo Carneiro
Apprentissage des étiquettes bruitées dépendantes de l’instance par modélisation graphique
Résumé

Les étiquettes bruitées sont inévitables mais problématiques dans l’écosystème de l’apprentissage profond, car les modèles peuvent facilement surajuster ces étiquettes. Il existe plusieurs types de bruit d’étiquetage, tels que le bruit symétrique, le bruit asymétrique et le bruit dépendant de l’instance (IDN, instance-dependent noise), lequel est le seul type dépendant des informations contenues dans les images. Cette dépendance vis-à-vis des caractéristiques visuelles rend le bruit IDN un type critique à étudier, étant donné que les erreurs d’étiquetage sont en grande partie dues à une information insuffisante ou ambiguë concernant les classes visuelles présentes dans les images. Dans le but de proposer une technique efficace pour traiter le bruit IDN, nous présentons une nouvelle approche de modélisation graphique appelée InstanceGM, qui combine des modèles discriminatifs et génératifs. Les contributions principales d’InstanceGM sont les suivantes : i) l’utilisation de la distribution de Bernoulli continue pour entraîner le modèle génératif, offrant des avantages significatifs en matière d’entraînement, et ii) l’exploration d’un classificateur discriminatif à bruit d’étiquetage d’état de l’art afin de générer des étiquettes propres à partir d’échantillons présentant un bruit d’étiquetage dépendant de l’instance. InstanceGM est compétitive par rapport aux approches actuelles d’apprentissage avec étiquettes bruitées, en particulier dans les benchmarks de bruit IDN utilisant des jeux de données synthétiques et réels, où notre méthode obtient une meilleure précision que les concurrents dans la plupart des expériences.