HyperAIHyperAI
il y a 17 jours

Convolution rotationnelle adaptative pour la détection d'objets en rotation

Yifan Pu, Yiru Wang, Zhuofan Xia, Yizeng Han, Yulin Wang, Weihao Gan, Zidong Wang, Shiji Song, Gao Huang
Convolution rotationnelle adaptative pour la détection d'objets en rotation
Résumé

La détection d'objets orientés vise à identifier et localiser des objets dans des images présentant une orientation arbitraire. Dans ce contexte, les directions orientées des objets varient considérablement d'une image à l'autre, tout en existant simultanément sous plusieurs orientations au sein d'une même image. Cette caractéristique intrinsèque rend difficile pour les réseaux de base standards d'extraire des caractéristiques de haute qualité pour ces objets orientés de manière arbitraire. Dans cet article, nous proposons le module Adaptatif de Convolution Orientée (ARC) afin de relever ces défis. Dans notre module ARC, les noyaux de convolution s'ajustent automatiquement à la rotation pour extraire les caractéristiques des objets aux orientations variables dans différentes images, tandis qu'un mécanisme efficace de calcul conditionnel est introduit pour gérer les grandes variations d'orientation des objets au sein d'une même image. Ces deux mécanismes s'associent de manière fluide dans le cadre de la détection d'objets orientés. En outre, le module ARC peut facilement être intégré comme un composant plug-and-play dans diverses architectures de vision, afin d'améliorer leur capacité de représentation pour une détection précise des objets orientés. Des expériences sur des benchmarks couramment utilisés (DOTA et HRSC2016) démontrent que l'ajout de notre module ARC au réseau de base permet d'améliorer significativement les performances de plusieurs détecteurs d'objets orientés populaires (par exemple, +3,03 % de mAP sur Rotated RetinaNet et +4,16 % sur CFA). En combinaison avec la méthode hautement performante Oriented R-CNN, l'approche proposée atteint un résultat de pointe sur le jeu de données DOTA, avec une mAP de 81,77 %. Le code source est disponible à l'adresse suivante : \url{https://github.com/LeapLabTHU/ARC}.