Convolution déformable à priori d’échelle pour le comptage guidé par exemple et indépendant de la classe

Le comptage sans catégorisation a récemment émergé comme une tâche de comptage plus pratique, visant à prédire le nombre et la répartition d’objets quelconques, plutôt que de compter des catégories spécifiques telles que les piétons ou les voitures. Toutefois, les méthodes récentes sont conçues en établissant des règles appropriées de correspondance de similarité entre les exemplaires et les images de requête, tout en ignorant la robustesse des caractéristiques extraites. Pour résoudre ce problème, nous proposons une convolution déformable à priori d’échelle, intégrant des informations des exemplaires, telles que l’échelle, dans le noyau du réseau de comptage. En conséquence, le réseau de comptage proposé peut extraire des caractéristiques sémantiques d’objets similaires aux exemplaires fournis, tout en filtrant efficacement les arrière-plans non pertinents. Par ailleurs, nous constatons que les pertes classiques L2 et généralisée ne conviennent pas au comptage sans catégorisation en raison de la variabilité des échelles des objets entre différents échantillons. Nous proposons donc une perte généralisée sensible à l’échelle, capable d’ajuster la formulation de la fonction de coût en fonction des exemplaires donnés, rendant ainsi la différence entre la prédiction et la vérité terrain plus marquée. Des expériences étendues montrent que notre modèle obtient une amélioration significative et atteint des performances de pointe sur une base de données publique de comptage sans catégorisation. Le code source est disponible à l’adresse suivante : https://github.com/Elin24/SPDCN-CAC.