HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage robuste de modèle guidé par priorité d’échantillonnage pour supprimer les étiquettes bruitées

Wenkai Chen Chuang Zhu Yi Chen Mengting Li Tiejun Huang

Résumé

Les étiquettes imparfaites sont omniprésentes dans les jeux de données du monde réel et nuisent sérieusement à la performance des modèles. Plusieurs méthodes récentes efficaces pour traiter les étiquettes bruyantes reposent sur deux étapes clés : 1) partitionner les échantillons en ensembles correctement étiquetés et mal étiquetés à partir de la perte d'entraînement, et 2) utiliser des méthodes semi-supervisées pour générer des pseudo-étiquettes pour les échantillons de l'ensemble mal étiqueté. Toutefois, les méthodes actuelles nuisent fréquemment aux échantillons informatifs difficiles, en raison de la similarité de la distribution de la perte entre ces derniers et les échantillons bruyants. Dans cet article, nous proposons PGDF (Prior Guided Denoising Framework), un cadre novateur permettant d’apprendre un modèle profond afin de supprimer le bruit en générant des connaissances a priori sur les échantillons, intégrées à la fois à l’étape de partitionnement et à l’étape semi-supervisée. Notre cadre permet de préserver davantage les échantillons propres difficiles, qui sont informatifs, dans l’ensemble correctement étiqueté. Par ailleurs, il améliore également la qualité des pseudo-étiquettes lors de l’étape semi-supervisée en supprimant le bruit dans le processus actuel de génération des pseudo-étiquettes. Pour renforcer davantage les échantillons difficiles, nous réévaluons les poids des échantillons de l’ensemble correctement étiqueté pendant l’entraînement. Nous avons évalué notre méthode sur des jeux de données synthétiques basés sur CIFAR-10 et CIFAR-100, ainsi que sur des jeux de données du monde réel tels que WebVision et Clothing1M. Les résultats démontrent des améliorations substantielles par rapport aux méthodes de pointe.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp