HyperAIHyperAI

Command Palette

Search for a command to run...

Régression pénalisée évolutif pour la détection du bruit dans l’apprentissage avec des étiquettes bruyantes

Yikai Wang Xinwei Sun Yanwei Fu

Résumé

Un ensemble d'apprentissage bruité entraîne généralement une dégradation de la généralisation et de la robustesse des réseaux de neurones. Dans cet article, nous proposons d'utiliser un cadre théoriquement garanti pour la détection des étiquettes bruyantes afin de détecter et d'éliminer les données erronées dans le cadre de l'apprentissage avec des étiquettes bruyantes (LNL). Plus précisément, nous concevons une régression pénalisée pour modéliser la relation linéaire entre les caractéristiques du réseau et les étiquettes one-hot, où les données bruyantes sont identifiées à partir des paramètres de décalage de moyenne non nuls obtenus par le modèle de régression. Pour rendre ce cadre évolutive aux jeux de données comportant un grand nombre de catégories et d’échantillons d’apprentissage, nous proposons un algorithme de découpage qui divise l’ensemble d’apprentissage complet en petites parties pouvant être traitées en parallèle par la régression pénalisée, conduisant ainsi au cadre Scalable Penalized Regression (SPR). Nous fournissons une condition probabiliste non asymptotique garantissant que SPR identifie correctement les données bruyantes. Bien que SPR puisse être considéré comme un module de sélection d’échantillons intégré à un pipeline d’apprentissage supervisé classique, nous l’associons également à un algorithme semi-supervisé afin d’exploiter davantage le potentiel des données bruyantes comme données non étiquetées. Les résultats expérimentaux sur plusieurs jeux de données standards ainsi que sur des jeux de données réels bruyants démontrent l’efficacité de notre cadre. Le code source et les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/Yikai-Wang/SPR-LNL.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp