HyperAIHyperAI
il y a 3 mois

BBN : Réseau à branches bilatérales avec apprentissage cumulatif pour la reconnaissance visuelle à longue queue

Boyan Zhou, Quan Cui, Xiu-Shen Wei, Zhao-Min Chen
BBN : Réseau à branches bilatérales avec apprentissage cumulatif pour la reconnaissance visuelle à longue queue
Résumé

Notre travail se concentre sur la tâche délicate mais naturelle de la reconnaissance visuelle dans le cadre de distributions de données à queue longue (c’est-à-dire que quelques classes concentrent la majorité des données, tandis que la grande majorité des classes ne disposent que de très peu d’échantillons). Dans la littérature, les stratégies de rééquilibrage des classes (par exemple, le rééchantillonnage et le répoids) constituent les méthodes les plus pertinentes et efficaces proposées pour atténuer l’imprégnation extrême rencontrée dans les problèmes à queue longue. Dans cet article, nous découvrons tout d’abord que les performances satisfaisantes en précision de reconnaissance obtenues par ces méthodes de rééquilibrage s’expliquent par leur capacité à améliorer significativement l’apprentissage du classificateur dans les réseaux profonds. Toutefois, parallèlement, ces méthodes endommagent involontairement, dans une certaine mesure, la capacité représentative des caractéristiques profondes apprises. Ainsi, nous proposons un réseau unifié à deux branches (Bilateral-Branch Network, BBN) capable de traiter simultanément l’apprentissage représentatif et l’apprentissage du classificateur, chaque branche assurant une fonction spécifique de manière indépendante. En outre, notre modèle BBN intègre une nouvelle stratégie d’apprentissage cumulatif, conçue pour d’abord apprendre les motifs universels, puis progressivement se concentrer sur les données des classes rares. Des expérimentations étendues sur quatre jeux de données standard, y compris le grand jeu iNaturalist, démontrent que le BBN proposé surpasse significativement les méthodes de pointe. Par ailleurs, des expérimentations de validation confirment à la fois notre découverte préliminaire et l’efficacité des conceptions spécifiques intégrées au BBN pour les problèmes à queue longue. Notre méthode a remporté la première place au concours de classification des espèces à grande échelle iNaturalist 2019, et le code source est disponible publiquement à l’adresse suivante : https://github.com/Megvii-Nanjing/BBN.