ReDet : Un détecteur rotationnel-équivariant pour la détection d'objets aériens

Récemment, la détection d’objets dans les images aériennes a suscité un intérêt croissant en vision par ordinateur. Contrairement aux objets présents dans les images naturelles, les objets aériens sont souvent orientés de manière arbitraire. Par conséquent, les détecteurs doivent intégrer un nombre plus important de paramètres pour encoder les informations d’orientation, ce qui entraîne souvent une redondance importante et une inefficacité. En outre, comme les réseaux de neurones convolutifs classiques ne modélisent pas explicitement les variations d’orientation, une grande quantité de données augmentées par rotation est nécessaire pour entraîner un détecteur précis. Dans cet article, nous proposons un détecteur rotation-équivalent, appelé ReDet, afin de résoudre ces problèmes en encodant explicitement l’équivalence et l’invariance rotationnelles. Plus précisément, nous intégrons des réseaux rotation-équivalents dans le détecteur afin d’extraire des caractéristiques rotation-équivalentes, capables de prédire avec précision l’orientation tout en permettant une réduction considérable de la taille du modèle. Sur la base de ces caractéristiques rotation-équivalentes, nous introduisons également une méthode appelée Rotation-invariant RoI Align (RiRoI Align), qui extrait de manière adaptative des caractéristiques rotation-invariantes à partir des caractéristiques équivalentes, en fonction de l’orientation de chaque région d’intérêt (RoI). Des expérimentations étendues sur plusieurs jeux de données challengers d’images aériennes — DOTA-v1.0, DOTA-v1.5 et HRSC2016 — montrent que notre méthode atteint des performances de pointe dans la tâche de détection d’objets aériens. Par rapport aux résultats précédents les plus performants, ReDet améliore les scores mAP de 1,2, 3,5 et 2,6 respectivement sur DOTA-v1.0, DOTA-v1.5 et HRSC2016, tout en réduisant le nombre de paramètres de 60 % (313 Mo contre 121 Mo). Le code est disponible à l’adresse suivante : \url{https://github.com/csuhan/ReDet}.