HyperAIHyperAI

Command Palette

Search for a command to run...

Centralité et cohérence : identification en deux étapes d’échantillons propres pour l’apprentissage avec des étiquettes bruitées dépendantes des instances

Ganlong Zhao Guanbin Li Yipeng Qin Feng Liu Yizhou Yu

Résumé

Les modèles profonds entraînés avec des étiquettes bruitées sont sujets au surapprentissage et rencontrent des difficultés en généralisation. La plupart des solutions existantes reposent sur une hypothèse idéale selon laquelle le bruit d’étiquette est conditionnel par classe, c’est-à-dire que les instances d’une même classe partagent le même modèle de bruit, indépendamment des caractéristiques. Toutefois, en pratique, les motifs de bruit réels sont généralement plus fins et dépendants des instances, ce qui pose un défi important, notamment en présence d’un déséquilibre entre les classes. Dans cet article, nous proposons une méthode en deux étapes pour identifier les échantillons propres afin de relever ce défi. Premièrement, nous mettons en œuvre une procédure de regroupement par caractéristiques au niveau de la classe afin d’identifier précocement les échantillons propres situés près des centres de prédiction par classe. Notamment, nous traitons le problème du déséquilibre de classes en regroupant les classes rares selon leur entropie de prédiction. Deuxièmement, pour les échantillons propres restants, situés près de la frontière de classe réelle (souvent mélangés à des échantillons présentant un bruit dépendant de l’instance), nous proposons une nouvelle méthode de classification fondée sur la cohérence, qui identifie ces échantillons à partir de la cohérence entre deux têtes de classificateur : plus la cohérence est élevée, plus la probabilité qu’un échantillon soit propre est grande. Des expériences étendues sur plusieurs benchmarks exigeants démontrent la supériorité de notre méthode par rapport aux états de l’art.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp