HyperAIHyperAI
il y a 17 jours

RFLA : Affectation de balises basée sur le champ réceptif gaussien pour la détection d'objets microscopiques

Chang Xu, Jinwang Wang, Wen Yang, Huai Yu, Lei Yu, Gui-Song Xia
RFLA : Affectation de balises basée sur le champ réceptif gaussien pour la détection d'objets microscopiques
Résumé

La détection d’objets de très petite taille constitue l’un des principaux obstacles freinant le développement de la détection d’objets. Les détecteurs génériques voient leur performance fortement dégradée sur les tâches de détection d’objets minuscules. Dans cet article, nous observons que soit la priorité par boîte dans les détecteurs basés sur des ancres, soit la priorité par point dans les détecteurs sans ancre, s’avèrent sous-optimales pour les objets de petite taille. Notre observation clé est que les paradigmes actuels d’attribution des étiquettes, qu’ils soient basés sur des ancres ou sans ancres, entraînent une grande quantité d’échantillons vérités terrain de taille minuscule considérés comme des outliers, ce qui conduit les détecteurs à accorder moins d’attention aux objets de petite taille. Afin de remédier à ce problème, nous proposons une stratégie d’attribution d’étiquettes basée sur le champ réceptif gaussien (RFLA) pour la détection d’objets minuscules. Plus précisément, RFLA exploite d’abord l’information a priori selon laquelle le champ réceptif des caractéristiques suit une distribution gaussienne. Ensuite, au lieu d’attribuer des étiquettes selon des critères basés sur l’IoU ou l’échantillonnage centré, nous introduisons une nouvelle mesure de similarité, appelée distance de champ réceptif (RFD), pour évaluer directement la proximité entre le champ réceptif gaussien et la vérité terrain. Étant donné que les stratégies d’attribution basées sur un seuil d’IoU ou l’échantillonnage centré sont biaisées en faveur des objets de grande taille, nous concevons également un module d’attribution d’étiquettes hiérarchique (HLA) fondé sur la RFD afin d’assurer un apprentissage équilibré pour les objets minuscules. Des expérimentations étendues sur quatre jeux de données démontrent l’efficacité de la méthode proposée. En particulier, notre approche obtient une amélioration de 4,0 points d’AP par rapport aux méthodes de pointe sur le jeu de données AI-TOD. Le code est disponible à l’adresse suivante : https://github.com/Chasel-Tsui/mmdet-rfla