Retouche d’ancrage par interaction de modèles pour une détection d’objets robuste dans les images aériennes

La détection d’objets a connu des progrès considérables en vision par ordinateur. La détection d’objets de petite taille souffrant d’une dégradation de leur apparence constitue un défi majeur, particulièrement dans le contexte des observations aériennes. Afin de recueillir un nombre suffisant d’échantillons positifs/négatifs pour l’entraînement heuristique, la plupart des détecteurs d’objets préfixent des régions-anchor afin de calculer le taux d’intersection sur union (IoU) par rapport aux données de référence. Dans ce cadre, les objets de petite taille sont fréquemment ignorés ou mal étiquetés. Dans cet article, nous proposons un réseau efficace appelé Dynamic Enhancement Anchor (DEA) afin de concevoir un nouveau générateur d’échantillons d’entraînement. Contrairement aux techniques les plus avancées actuelles, le réseau proposé utilise un discriminateur d’échantillons pour permettre un filtrage interactif entre une unité basée sur des anchors et une unité sans anchor, afin de produire des échantillons valides. Par ailleurs, l’entraînement conjoint multi-tâches combiné à un schéma d’inférence conservateur basé sur des anchors améliore les performances du modèle proposé tout en réduisant sa complexité computationnelle. La méthode proposée est compatible avec les tâches de détection d’objets orientés comme horizontaux. Des expérimentations étendues sur deux benchmarks aériens exigeants (à savoir DOTA et HRSC2016) montrent que notre approche atteint des performances de pointe en précision, tout en assurant une vitesse d’inférence modérée et une charge computationnelle raisonnable durant l’entraînement. Sur DOTA, notre DEA-Net, intégrant le modèle de base RoI-Transformer, dépasse la méthode avancée de 0,40 % en moyenne de précision (mAP) pour la détection d’objets orientés, avec un réseau de base plus faible (ResNet-101 contre ResNet-152), et de 3,08 % en mAP pour la détection horizontale, avec le même réseau de base. Par ailleurs, notre DEA-Net intégrant le modèle de base ReDet atteint une performance de pointe de 80,37 %. Sur HRSC2016, il dépasse le meilleur modèle précédent de 1,1 % en utilisant uniquement 3 anchors horizontaux.