HyperAIHyperAI

Command Palette

Search for a command to run...

Coresets pour l'entraînement robuste des réseaux de neurones contre les étiquettes bruitées

Baharan Mirzasoleiman Kaidi Cao Jure Leskovec

Résumé

Les réseaux neuronaux modernes ont la capacité de s’overfitter les étiquettes bruitées fréquemment présentes dans les jeux de données du monde réel. Bien que des progrès considérables aient été accomplis, les techniques existantes restent limitées quant à leur capacité à offrir des garanties théoriques sur les performances des réseaux neuronaux entraînés avec des étiquettes bruitées. Dans cet article, nous proposons une nouvelle approche, fondée sur des garanties théoriques solides, pour un entraînement robuste des réseaux profonds en présence d’étiquettes bruitées. L'idée centrale de notre méthode consiste à sélectionner des sous-ensembles pondérés (appelés coreset) de points de données propres, dont la matrice jacobienne approximativement de faible rang. Nous démontrons ensuite que la descente de gradient appliquée à ces sous-ensembles ne conduit pas à un overfitting des étiquettes bruitées. Nos expériences étendues confirment notre théorie et montrent que les réseaux profonds entraînés sur nos sous-ensembles atteignent une performance significativement supérieure à celle des méthodes de pointe : une augmentation de 6 % de précision sur CIFAR-10 avec 80 % d’étiquettes bruitées, et une augmentation de 7 % sur mini Webvision.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp