HyperAIHyperAI
il y a 17 jours

Une distance de Wasserstein gaussienne normalisée pour la détection d'objets de petite taille

Jinwang Wang, Chang Xu, Wen Yang, Lei Yu
Une distance de Wasserstein gaussienne normalisée pour la détection d'objets de petite taille
Résumé

La détection d’objets de petite taille constitue un problème extrêmement difficile, car un objet de petite taille ne contient qu’un nombre réduit de pixels. Nous démontrons que les détecteurs de pointe ne parviennent pas à produire des résultats satisfaisants pour les objets de petite taille en raison du manque d’informations d’apparence. Notre observation clé est que les métriques basées sur le taux d’intersection sur union (IoU), telles que l’IoU elle-même et ses variantes, sont très sensibles aux déviations de position des objets de petite taille, ce qui entraîne une dégradation marquée des performances de détection lorsqu’elles sont utilisées dans des détecteurs basés sur des ancres. Pour atténuer ce problème, nous proposons une nouvelle métrique d’évaluation fondée sur la distance de Wasserstein pour la détection d’objets de petite taille. Plus précisément, nous modélisons d’abord les boîtes englobantes comme des distributions gaussiennes en deux dimensions, puis introduisons une nouvelle métrique, appelée Distance de Wasserstein Normalisée (NWD), pour mesurer la similarité entre ces boîtes à partir de leurs distributions gaussiennes correspondantes. La métrique NWD proposée peut être facilement intégrée dans l’étape d’assignation, la suppression non maximale et la fonction de perte de tout détecteur basé sur des ancres, afin de remplacer la métrique IoU couramment utilisée. Nous évaluons notre métrique sur un nouveau jeu de données dédié à la détection d’objets de petite taille (AI-TOD), dont la taille moyenne des objets est significativement plus petite que celle des jeux de données existants pour la détection d’objets. Des expériences étendues montrent que, en utilisant la métrique NWD, notre approche atteint des performances supérieures de 6,7 points d’AP par rapport à une base de fine-tuning standard, et de 6,0 points d’AP par rapport aux meilleurs détecteurs actuels. Le code est disponible à l’adresse suivante : https://github.com/jwwangchn/NWD.

Une distance de Wasserstein gaussienne normalisée pour la détection d'objets de petite taille | Articles de recherche récents | HyperAI