Apprentissage de RoI Transformer pour la détection d'objets orientés dans les images aériennes

La détection d'objets dans les images aériennes est une tâche active mais difficile en vision par ordinateur en raison de la perspective oiseau-de-proie, des arrière-plans hautement complexes et des apparences variables des objets. En particulier, lors de la détection d'objets fortement regroupés dans les images aériennes, les méthodes basées sur des propositions horizontales pour la détection d'objets courants introduisent souvent des incompatibilités entre les régions d'intérêt (RoIs) et les objets. Cela entraîne un décalage courant entre la confiance finale de classification des objets et la précision de localisation. Bien que des ancres rotatives aient été utilisées pour résoudre ce problème, leur conception multiplie toujours le nombre d'ancres et augmente considérablement la complexité computationnelle. Dans cet article, nous proposons un RoI Transformer pour aborder ces problèmes. Plus précisément, afin d'améliorer la qualité des propositions de régions, nous avons tout d'abord conçu un apprenant de RoI Rotatif (RRoI) pour transformer une région d'intérêt horizontale (HRoI) en une région d'intérêt rotative (RRoI). Sur la base des RRoIs, nous avons ensuite proposé un module de RRoI Align sensible à la position rotative (RPS-RoI-Align) pour extraire des caractéristiques invariantes à la rotation à partir de ces régions afin de renforcer la classification et la régression ultérieures. Notre RoI Transformer est léger et peut être facilement intégré aux détecteurs pour la détection d'objets orientés. Une implémentation simple du RoI Transformer a obtenu des performances de pointe sur deux jeux de données aériens courants et difficiles, à savoir DOTA et HRSC2016, avec une réduction négligeable de la vitesse de détection. Notre RoI Transformer dépasse le pooling Position Sensitive déformable lorsque des annotations de boîtes englobantes orientées sont disponibles. De nombreux expériences ont également validé la flexibilité et l'efficacité de notre RoI Transformer. Les résultats montrent qu'il peut être facilement intégré à d'autres architectures de détecteurs et améliorer significativement les performances.