Détection par zoom successif pour des images aériennes à haute résolution

La détection d’objets dans les images aériennes est un défi majeur, en raison de la présence typique d’objets petits et denses répartis de manière non uniforme sur des images haute résolution. La méthode de découpage selon la densité (density cropping) est largement utilisée pour améliorer la détection d’objets de petite taille : elle consiste à extraire et à traiter en haute résolution les régions riches en objets petits. Toutefois, cette approche repose généralement sur l’ajout de composants apprenables supplémentaires, ce qui complique le processus d’entraînement et d’inférence par rapport à une méthode de détection standard. Dans ce travail, nous proposons un détecteur efficace, appelé CZ (Cascaded Zoom-in), qui réutilise le détecteur lui-même pour une entraînement et une inférence guidées par la densité. Pendant l’entraînement, les régions de densité sont localisées, étiquetées comme une nouvelle classe, puis intégrées pour enrichir le jeu de données d’entraînement. Pendant l’inférence, ces régions sont d’abord détectées conjointement avec les objets de la classe de base, puis soumises à une deuxième étape d’inférence. Cette approche s’intègre facilement à tout détecteur existant, sans modifier de manière significative le processus standard de détection, contrairement à la méthode de découpage uniforme couramment utilisée dans la détection d’images aériennes. Les résultats expérimentaux sur les jeux de données exigeants VisDrone et DOTA, issus d’images aériennes, confirment les avantages de la méthode proposée. Le détecteur CZ atteint également des performances de pointe par rapport aux méthodes de découpage uniforme et aux autres approches de découpage selon la densité sur le jeu de données VisDrone, en améliorant le mAP (mean Average Precision) des objets de petite taille de plus de 3 points.