HyperAIHyperAI

Command Palette

Search for a command to run...

Optimisation fine catégorielle pour la classification multi-étiquettes d'images avec des étiquettes partielles

Yapeng Wang Wei Ke Tenglong Wang Xu Yang Chak Fong Chong

Résumé

Les jeux de données pour la classification multi-étiquettes d’images sont souvent partiellement étiquetés (pour chaque échantillon, seules certaines étiquettes parmi les catégories sont connues). Une solution courante pour entraîner des réseaux de neurones convolutifs consiste à traiter toutes les étiquettes inconnues comme des étiquettes négatives, une approche connue sous le nom de « mode Négatif ». Toutefois, cette méthode introduit des étiquettes erronées de manière inégale par catégorie, ce qui entraîne une dégradation inégale de la performance de classification binaire selon les catégories. À l’inverse, bien que le « mode Ignorer », qui ignore la contribution des étiquettes inconnues, puisse être moins efficace que le mode Négatif, il garantit que les données ne contiennent pas d’étiquettes erronées supplémentaires — une caractéristique que le mode Négatif ne possède pas. Dans cet article, nous proposons une nouvelle méthode post-entraînement appelée CFT (Category-wise Fine-Tuning), qui peut être appliquée à un modèle entraîné en mode Négatif afin d’améliorer sa performance de manière indépendante pour chaque catégorie. Plus précisément, CFT utilise le mode Ignorer pour ajuster successivement les régressions logistiques (LR) situées dans la couche de classification. L’utilisation du mode Ignorer permet de réduire les dégradations de performance causées par les étiquettes erronées introduites lors de l’entraînement en mode Négatif. En particulier, l’algorithme génétique (GA) et la fonction de perte binaire entropique croisée sont employés dans CFT pour ajuster les régressions logistiques. L’efficacité de notre méthode a été évaluée sur le jeu de données de la compétition CheXpert, où elle atteint, à notre connaissance, des résultats de pointe. Un modèle unique soumis au serveur officiel de la compétition obtient un mAUC de 91,82 % sur l’ensemble de test, ce qui représente le meilleur score obtenu par un modèle unique dans le classement et dans la littérature. En outre, notre modèle en ensemble atteint un mAUC de 93,33 % sur l’ensemble de test (la compétition étant récemment close, nous avons évalué l’ensemble sur une machine locale après la mise à disposition du jeu de test). Ce résultat dépasse largement le meilleur score du classement et de la littérature (93,05 %). Enfin, l’efficacité de notre méthode a également été validée sur des versions partiellement étiquetées du jeu de données MS-COCO.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Optimisation fine catégorielle pour la classification multi-étiquettes d'images avec des étiquettes partielles | Articles | HyperAI