Perte guidée par la probabilité pour la classification d'images multi-étiquettes à queue longue
L'apprentissage à queue longue a attiré une attention croissante ces dernières années. La classification d'images multi-étiquettes à queue longue constitue une sous-tâche particulièrement difficile et peu explorée. Dans cet article, nous proposons une nouvelle perspective fondée sur la probabilité pour aborder ce problème. Plus précisément, nous observons que les méthodes existantes d'apprentissage sensible au coût pour la classification multi-étiquettes à queue longue influencent de manière variable les probabilités prédites des étiquettes positives et négatives durant l'entraînement, et que ces différences dans le processus de probabilité ont un impact direct sur les performances finales. Nous proposons donc une fonction de perte guidée par la probabilité, composée de deux composants permettant de contrôler ce processus. Le premier est une rééquilibration des probabilités, capable d’ajuster de manière flexible l’évolution des probabilités pendant l’entraînement. Le second est une focalisation adaptative consciente des probabilités, qui permet de réduire davantage l’écart entre les probabilités des étiquettes positives et négatives. Nous menons des expériences approfondies sur deux jeux de données de classification d'images multi-étiquettes à queue longue : VOC-LT et COCO-LT. Les résultats démontrent la pertinence et l’efficacité supérieure de notre stratégie.