DenoDet: Aufmerksamkeit als deformierbares Mehrfach-Unterraum-Feature-Denoising für Zielerkennung in SAR-Bildern

Die Erkennung von Zielen mit synthetischem Apertur-Radar (SAR) wurde lange durch das inhärente Punktgeräusch und die Häufigkeit kleiner, unklarer Ziele behindert. Obwohl tiefgreifende neuronale Netze den Fortschritt der SAR-Zielerkennung vorangetrieben haben, versagen ihre intrinsischen Niederfrequenzverzerrungen und statischen Gewichte nach der Schulung bei kohärentem Rauschen und der Erhaltung feiner Details in heterogenen Geländebedingungen. Inspiriert durch traditionelle SAR-Bildentrauschtechniken schlagen wir DenoDet vor, ein Netzwerk, das durch eine explizite Frequenzbereichstransformation unterstützt wird, um Faltungsvorschiebungen zu kalibrieren und mehr Aufmerksamkeit auf Hochfrequenzen zu lenken. Dies bildet eine natürliche Multiskalen-Unterraumdarstellung zur Zielerkennung aus der Perspektive des Multiskalen-Entrauschens. Wir entwerfen TransDeno, ein dynamisches Frequenzbereichs-Aufmerksamkeitsmodul, das als Transformationsbereichs-Weichschwelleoperation fungiert und dynamisch in den Untersräumen entrauscht, indem es wichtige Zielzeichen beibehält und Rauschen dämpft. Um die Granularität der Unterraumbearbeitung anpassbar zu gestalten, schlagen wir auch eine deformierbare Gruppen-Fully-Connected-Schicht (DeGroFC) vor, die sich dynamisch an die Eingabecharakteristika anpasst. Ohne zusätzliche Verzierungen erreicht unser einsteckbares TransDeno neue Spitzenwerte auf mehreren SAR-Zielerkennungsdatensätzen. Der Code ist unter https://github.com/GrokCV/GrokSAR verfügbar.