Apprentissage dynamique de grossier à fin pour la détection d'objets minuscules orientés

La détection d’objets microscopiques orientés arbitrairement pose des défis considérables aux détecteurs existants, en particulier en ce qui concerne l’affectation des étiquettes. Malgré les recherches récentes sur l’affectation adaptative des étiquettes dans les détecteurs d’objets orientés, la forme géométrique extrême et la faible richesse des caractéristiques des objets microscopiques orientés entraînent encore des problèmes sévères de désaccord et d’imprégnation. Plus précisément, le prior de position, les caractéristiques des échantillons positifs et l’instance elle-même sont mal alignés, et l’apprentissage des objets à forme extrême est biaisé et déséquilibré en raison d’un manque de supervision adaptée sur les caractéristiques. Pour relever ces défis, nous proposons un prior dynamique combiné à un assigneur de type grossier-vers-fin, nommé DCFL. D’une part, nous modélisons de manière dynamique le prior, l’affectation des étiquettes et la représentation des objets afin de réduire le désaccord. D’autre part, nous exploitons un alignement grossier basé sur le prior et une contrainte plus fine issue du postérieur pour assigner dynamiquement les étiquettes, offrant ainsi une supervision appropriée et relativement équilibrée pour des instances diverses. Des expériences étendues sur six jeux de données montrent des améliorations significatives par rapport à la base. Notamment, nous obtenons des performances de pointe pour les détecteurs à une étape sur les jeux de données DOTA-v1.5, DOTA-v2.0 et DIOR-R, dans des conditions d’entraînement et de test à échelle unique. Le code est disponible à l’adresse suivante : https://github.com/Chasel-Tsui/mmrotate-dcfl.