HyperAIHyperAI
il y a 2 mois

Classification équilibrée : Un cadre unifié pour la détection d'objets à queue longue

Qi, Tianhao ; Xie, Hongtao ; Li, Pandeng ; Ge, Jiannan ; Zhang, Yongdong
Classification équilibrée : Un cadre unifié pour la détection d'objets à queue longue
Résumé

Les détecteurs conventionnels subissent une dégradation des performances lorsqu'ils traitent des données à queue longue en raison d'un biais de classification en faveur des catégories majoritaires. Dans cet article, nous soutenons que ce biais d'apprentissage provient de deux facteurs : 1) la concurrence inégale résultant de la répartition déséquilibrée des catégories de premier plan, et 2) le manque de diversité des échantillons dans les catégories de queue. Pour résoudre ces problèmes, nous introduisons un cadre unifié appelé BAlanced CLassification (BACL), qui permet une correction adaptative des inégalités causées par les disparités dans la répartition des catégories et une intensification dynamique de la diversité des échantillons de manière synchronisée.Plus précisément, une nouvelle perte d'équilibre de classification du premier plan (Foreground Classification Balance Loss, FCBL) est développée pour atténuer la domination des catégories majoritaires et déplacer l'attention vers les catégories difficiles à différencier, respectivement, en introduisant des marges sensibles aux classes par paires et des termes de poids auto-ajustés. Cette perte empêche la sur-répression des catégories de queue dans le contexte d'une concurrence inégale.De plus, nous proposons un module de synthèse dynamique des caractéristiques (Dynamic Feature Hallucination Module, FHM), qui renforce la représentation des catégories de queue dans l'espace des caractéristiques en générant des échantillons synthétiques pour introduire une variance supplémentaire dans les données. Dans cette approche diviser-pour-régner, BACL établit un nouveau niveau d'excellence sur le benchmark difficile LVIS avec un pipeline d'entraînement découplé, surpassant le Faster R-CNN standard avec ResNet-50-FPN de 5,8% AP et 16,1% AP pour les catégories globales et les catégories de queue. De nombreuses expériences montrent que BACL améliore constamment les performances sur diverses bases de données avec différentes architectures et backbones.Le code source et les modèles sont disponibles à l'adresse suivante : https://github.com/Tianhao-Qi/BACL.

Classification équilibrée : Un cadre unifié pour la détection d'objets à queue longue | Articles de recherche récents | HyperAI