HyperAIHyperAI
il y a 17 jours

Correction améliorée des métalabels pour faire face à la corruption des étiquettes

Mitchell Keren Taraday, Chaim Baskin
Correction améliorée des métalabels pour faire face à la corruption des étiquettes
Résumé

Les méthodes traditionnelles d’apprentissage en présence d’étiquettes bruitées ont réussi à traiter des jeux de données sur lesquels du bruit a été artificiellement injecté, mais peinent encore à gérer efficacement le bruit présent dans les données du monde réel. Avec l’essor de l’apprentissage métadans divers domaines du machine learning, les chercheurs ont exploité des petits jeux de données propres auxiliaires afin de corriger métadynamiquement les étiquettes d’entraînement. Toutefois, les approches existantes de correction métad’étiquettes ne tirant pas pleinement parti de leur potentiel. Dans cette étude, nous proposons une approche améliorée de correction métad’étiquettes, abrégée en EMLC (Enhanced Meta Label Correction), destinée au problème d’apprentissage avec des étiquettes bruitées (LNL). Nous réexaminons le processus d’apprentissage métadans une optique de performance accrue, en introduisant des dérivées de métagradient plus rapides et plus précises. Nous proposons également une nouvelle architecture de modèle enseignant spécifiquement conçue pour le problème LNL, accompagnée d’objectifs d’entraînement novateurs. EMLC surpasser les approches antérieures et atteint des résultats de pointe sur toutes les benchmarks standards. Notamment, EMLC améliore l’état de l’art précédent sur le jeu de données réelle bruitée Clothing1M de $1,52\%$, tout en nécessitant seulement la moitié du temps par époque et en présentant une convergence bien plus rapide de l’objectif métad par rapport à l’approche de base.

Correction améliorée des métalabels pour faire face à la corruption des étiquettes | Articles de recherche récents | HyperAI