HyperAIHyperAI
il y a 3 mois

Classification fiable à queue longue

Bolian Li, Zongbo Han, Haining Li, Huazhu Fu, Changqing Zhang
Classification fiable à queue longue
Résumé

La classification sur des données distribuées en queue longue constitue un problème difficile, affecté par un déséquilibre de classes sévère et, par conséquent, par des performances médiocres, particulièrement pour les classes en queue. Récemment, les méthodes basées sur l’ensemblage ont atteint les performances les plus élevées à ce jour et montrent un grand potentiel. Toutefois, deux limitations persistent dans les approches actuelles. Premièrement, leurs prédictions ne sont pas fiables pour les applications sensibles aux erreurs, ce qui est particulièrement préjudiciable pour les classes en queue, où les erreurs de prédiction sont fréquentes. Deuxièmement, elles attribuent un nombre fixe d’experts à tous les échantillons, ce qui entraîne un gaspillage de ressources computationnelles pour les échantillons faciles. Pour surmonter ces défis, nous proposons une méthode de classification à queue longue fiable (Trustworthy Long-tailed Classification, TLC), qui mène conjointement la classification et l’estimation d’incertitude dans un cadre à multiples experts afin d’identifier les échantillons difficiles. Notre méthode TLC calcule l’incertitude fondée sur des preuves (Evidence-based Uncertainty, EvU) ainsi que les preuves pour chaque expert, puis combine ces incertitudes et ces preuves au sein de la théorie des preuves de Dempster-Shafer (DST). En outre, nous introduisons une stratégie d’engagement dynamique des experts, permettant de réduire le nombre d’experts impliqués pour les échantillons faciles, tout en préservant des performances prometteuses et en améliorant l’efficacité computationnelle. Enfin, nous menons des expériences approfondies sur plusieurs tâches : classification, détection des classes en queue, détection des données hors distribution (OOD) et prédiction des échecs. Les résultats expérimentaux démontrent que la méthode TLC proposée surpasser les approches existantes, tout en offrant une confiance accrue grâce à une estimation d’incertitude fiable et robuste.