Où sont les Blob : Comptage par Localisation avec Supervision Ponctuelle

Le décompte d'objets est une tâche importante en vision par ordinateur en raison de sa demande croissante dans des applications telles que la surveillance, le contrôle du trafic et le décompte d'objets quotidiens. Les méthodes les plus avancées utilisent une optimisation basée sur la régression, où elles apprennent explicitement à compter les objets d'intérêt. Ces méthodes se distinguent généralement par de meilleures performances que celles basées sur la détection, qui doivent maîtriser la tâche plus complexe de prédire la position, la taille et la forme de chaque objet. Cependant, nous proposons une méthode basée sur la détection qui n'a pas besoin d'estimer la taille et la forme des objets et qui surpassent les méthodes basées sur la régression. Nos contributions sont triples : (1) nous proposons une nouvelle fonction de perte qui incite le réseau à produire un seul blob par instance d'objet en utilisant uniquement des annotations au niveau des points ; (2) nous concevons deux méthodes pour diviser les grands blobs prédits entre les instances d'objets ; et (3) nous montrons que notre méthode atteint de nouveaux résultats de pointe sur plusieurs jeux de données difficiles, notamment le jeu de données Pascal VOC et le jeu de données Penguins. Notre méthode dépasse même celles qui utilisent une supervision plus forte, comme les caractéristiques de profondeur, les annotations multi-points et les étiquettes de boîtes englobantes.