HyperAIHyperAI
il y a 11 jours

Détection d'objets de petite taille pour les oiseaux avec Swin Transformer

{Ichiro Ide, Takahiro Komamizu, Takatsugu Hirayama, Yasutomo Kawanishi, TingWei Liu, Marc A. Kastner, Da Huo}
Résumé

La détection d'objets consiste à localiser des objets au sein d'une image. Cette tâche s'avère particulièrement difficile lorsqu'il s'agit de détecter des objets de petite taille. En plus de leur faible dimension, ces objets sont souvent affectés par des problèmes tels que le flou ou l'occlusion. Les méthodes actuelles de détection d'objets de petite taille sont principalement conçues pour des scénarios où les objets sont à la fois petits et denses, comme les piétons dans une foule ou des objets éloignés dans des images de télédétection. Toutefois, lorsque les objets cibles sont petits et rares, le manque de données d'entraînement rend plus difficile l'apprentissage de caractéristiques efficaces. Dans ce travail, nous proposons une méthode spécialisée pour la détection d'une catégorie spécifique d'objets de petite taille : les oiseaux. Plus précisément, nous améliorons les caractéristiques extraites par le « neck », c’est-à-dire le sous-réseau situé entre le modèle principal (backbone) et la tête de prédiction, en adoptant une architecture hiérarchique afin d’apprendre des représentations plus pertinentes. Nous utilisons le Swin Transformer pour redimensionner les caractéristiques d’image. En outre, nous ajustons la taille des fenêtres décalées afin de mieux s’adapter aux objets de petite taille. Les expérimentations montrent que l’association du neck basé sur Swin Transformer avec CenterNet permet d’obtenir de bonnes performances, notamment en modifiant la taille des fenêtres. Nous constatons également que des tailles de fenêtres plus petites (par défaut, 2) améliorent significativement le mAP pour la détection d’objets de petite taille.

Détection d'objets de petite taille pour les oiseaux avec Swin Transformer | Articles de recherche récents | HyperAI