Apprentissage d'ancres dynamiques pour la détection d'objets orientés de manière arbitraire

Les objets orientés de manière arbitraire apparaissent fréquemment dans les scènes naturelles, les photographies aériennes, les images de télédétection, etc., ce qui a attiré une attention considérable sur la détection d'objets orientés de manière arbitraire. De nombreux détecteurs rotatifs actuels utilisent un grand nombre d'ancre avec différentes orientations pour atteindre une alignement spatial avec les boîtes vérité-terrain, puis l'Intersection-sur-Union (IoU) est appliquée pour échantillonner les candidats positifs et négatifs lors de l'entraînement. Cependant, nous constatons que les ancrages positifs sélectionnés ne garantissent pas toujours des détections précises après régression, tandis que certains échantillons négatifs peuvent atteindre une localisation précise. Cela indique que l'évaluation de la qualité des ancres par le biais de l'IoU n'est pas appropriée et cela conduit à une incohérence entre la confiance en classification et la précision de localisation. Dans cet article, nous proposons une méthode d'apprentissage dynamique des ancres (DAL), qui utilise le nouveau degré de correspondance défini pour évaluer globalement le potentiel de localisation des ancres et effectuer un processus d'affectation d'étiquettes plus efficace. Ainsi, le détecteur peut sélectionner dynamiquement des ancres de haute qualité pour réaliser une détection d'objets précise, et l'écart entre la classification et la régression sera atténué. Avec cette nouvelle DAL introduite, nous obtenons des performances de détection supérieures pour les objets orientés de manière arbitraire en utilisant seulement quelques ancres prédéfinies horizontales. Les résultats expérimentaux sur trois jeux de données de télédétection HRSC2016, DOTA, UCAS-AOD ainsi qu'un jeu de données textuel ICDAR 2015 montrent que notre méthode apporte une amélioration substantielle par rapport au modèle de base. De plus, notre approche est également universelle pour la détection d'objets utilisant des boîtes englobantes horizontales. Le code source et les modèles sont disponibles à l'adresse suivante : https://github.com/ming71/DAL.