R-CNN orienté pour la détection d'objets

Les détecteurs à deux étapes de pointe actuels génèrent des propositions orientées au moyen de méthodes coûteuses en temps, ce qui réduit leur vitesse et constitue un goulot d’étranglement computationnel dans les systèmes avancés de détection d’objets orientés. Ce travail propose un cadre efficace et simple pour la détection d’objets orientés, nommé Oriented R-CNN, un détecteur à deux étapes généralisable offrant à la fois une précision et une efficacité prometteuses. Plus précisément, dans la première étape, nous proposons un réseau de propositions régionales orientées (oriented RPN) capable de générer directement des propositions orientées de haute qualité de manière quasi sans coût. La deuxième étape consiste en une tête Oriented R-CNN pour affiner les régions d’intérêt orientées (oriented RoIs) et les reconnaître. Sans recourir à des astuces spéciales, Oriented R-CNN basé sur ResNet50 atteint des performances de détection de pointe sur deux jeux de données couramment utilisés pour la détection d’objets orientés, à savoir DOTA (75,87 % de mAP) et HRSC2016 (96,50 % de mAP), tout en atteignant une vitesse de 15,1 FPS pour des images de taille 1024×1024 sur une seule RTX 2080Ti. Nous espérons que ce travail incitera à repenser la conception des détecteurs orientés et pourra servir de référence (baseline) pour la détection d’objets orientés. Le code est disponible à l’adresse suivante : https://github.com/jbwang1997/OBBDetection.