Réseau de raffinement dynamique pour la détection d'objets orientés et densément regroupés

La détection d'objets a connu des progrès remarquables au cours de la dernière décennie. Toutefois, la détection d'objets orientés et fortement regroupés reste un défi en raison de raisons intrinsèques suivantes : (1) les champs réceptifs des neurones sont tous alignés sur les axes et de forme identique, tandis que les objets présentent généralement des formes variées et s'orientent selon diverses directions ; (2) les modèles de détection sont habituellement entraînés avec des connaissances générales et peuvent ne pas se généraliser efficacement pour traiter des objets spécifiques au moment du test ; (3) la disponibilité limitée des jeux de données entrave le développement de cette tâche. Pour résoudre les deux premiers problèmes, nous proposons un réseau de raffinement dynamique composé de deux nouveaux composants : un module de sélection de caractéristiques (FSM) et une tête de raffinement dynamique (DRH). Notre FSM permet aux neurones d’ajuster leurs champs réceptifs en fonction des formes et des orientations des objets cibles, tandis que la DRH permet à notre modèle de raffiner dynamiquement les prédictions de manière consciente des objets. Pour pallier le manque de benchmarks pertinents, nous avons collecté un jeu de données étendu et entièrement annoté, nommé SKU110K-R, qui a été réétiqueté à l’aide de boîtes englobantes orientées à partir du jeu de données SKU110K. Nous avons mené des évaluations quantitatives sur plusieurs benchmarks publics, notamment DOTA, HRSC2016, SKU110K et notre propre jeu de données SKU110K-R. Les résultats expérimentaux montrent que notre méthode obtient des améliorations constantes et significatives par rapport aux approches de référence. Le code source et le jeu de données sont disponibles à l’adresse suivante : https://github.com/Anymake/DRN_CVPR2020.