DenoDet : L'attention comme débruitage multi-sous-espaces déformables pour la détection de cibles dans les images SAR

La détection de cibles par radar à synthèse d'ouverture (RSO) a longtemps été entravée par le bruit de tache inhérent et la prévalence de cibles minuscules et ambiguës. Bien que les réseaux neuronaux profonds aient progressé dans la détection de cibles RSO, leur biais intrinsèque en fréquences basses et leurs poids statiques après l'entraînement peinent à gérer le bruit cohérent et à préserver les détails subtils sur des terrains hétérogènes. Inspirés par les méthodes traditionnelles de débruitage d'images RSO, nous proposons DenoDet, un réseau assisté par une transformation explicite dans le domaine fréquentiel pour calibrer les biais convolutifs et accorder plus d'attention aux hautes fréquences, formant ainsi une représentation naturelle multi-échelle pour détecter les cibles sous l'angle du débruitage multi-sous-espace. Nous avons conçu TransDeno, un module dynamique d'attention dans le domaine fréquentiel qui agit comme une opération de seuillage doux dans le domaine transformé, en débruitant dynamiquement à travers les sous-espaces en préservant les signaux cibles saillants et en atténuant le bruit. Pour ajuster adaptivement la granularité du traitement des sous-espaces, nous proposons également une couche entièrement connectée déformable par groupe (DeGroFC) qui varie dynamiquement le groupe en fonction des caractéristiques d'entrée. Sans artifices superflus, notre module TransDeno prêt à l'emploi établit des scores de pointe sur plusieurs jeux de données de détection de cibles RSO. Le code est disponible sur https://github.com/GrokCV/GrokSAR.