HyperAIHyperAI
il y a 10 jours

Reconnaissance des classes longues par routage d'experts diversifiés sensibles aux distributions

Xudong Wang, Long Lian, Zhongqi Miao, Ziwei Liu, Stella X. Yu
Reconnaissance des classes longues par routage d'experts diversifiés sensibles aux distributions
Résumé

Les données naturelles sont souvent distribuées selon une loi à queue longue par rapport aux classes sémantiques. Les méthodes existantes de reconnaissance tentent de traiter cette classification déséquilibrée en accordant une plus grande importance aux données de la queue, par rééquilibrage ou répoids des classes, ou encore par ensemblage sur différents groupes de données, ce qui conduit à une amélioration de la précision sur les classes rares mais à une baisse de la précision sur les classes dominantes.Nous adoptons une perspective dynamique sur les données d'entraînement et proposons une analyse rigoureuse du biais et de la variance du modèle lorsque ces données fluctuent : les classificateurs existants à queue longue augmentent inévitablement la variance du modèle, et l'écart de biais entre les classes dominantes et les classes rares reste important, en raison d'une confusion accrue et plus importante avec les exemples négatifs difficiles pour les classes rares.Nous proposons un nouveau classificateur à queue longue appelé RoutIng Diverse Experts (RIDE). Ce modèle réduit la variance du modèle grâce à l'emploi de multiples experts, diminue le biais grâce à une perte de diversité consciente de la distribution, et réduit les coûts computationnels grâce à un module de routage dynamique des experts. RIDE surpasser l'état de l'art de 5 à 7 % sur les benchmarks CIFAR100-LT, ImageNet-LT et iNaturalist 2018. Il constitue également un cadre universel, applicable à divers réseaux de base (backbones), algorithmes à queue longue et mécanismes d'entraînement, offrant ainsi des gains de performance constants. Notre code est disponible à l'adresse suivante : https://github.com/frank-xwang/RIDE-LongTailRecognition.