LEGNet: 저품질 원격 감지 이미지 객체 탐지를 위한 경량 엣지-га우시안 기반 네트워크

원격 탐사 객체 탐지(RSOD)는 낮은 공간 해상도, 센서 노이즈, 운동 왜곡, 불리한 조명 등의 품질 저하 문제로 인해 흔히 영향을 받는다. 이러한 요인들은 특징의 구별력을 저하시켜 객체 표현의 모호성과 전경-배경 분리의 부족을 초래한다. 기존의 RSOD 방법들은 저품질 객체에 대한 강건한 탐지 능력에서 한계를 보이고 있다. 이러한 시급한 과제를 해결하기 위해, 우리는 저품질 원격 탐사 이미지에서 유도된 특징 표현을 향상시키기 위해 특별히 설계된 새로운 엣지-가우시안 집계(Edge-Gaussian Aggregation, EGA) 모듈을 탑재한 경량 기반 네트워크인 LEGNet을 제안한다. EGA 모듈은 다음과 같은 두 가지 요소를 통합한다: (a) 방향 인지형 Scharr 필터를 활용하여 저대비 또는 왜곡된 객체에서 흔히 손실되는 중요한 엣지 세부 정보를 선명하게 강화하고, (b) 가우시안 사전 기반의 특징 정제를 통해 노이즈를 억제하고 모호한 특징 응답을 정규화함으로써 어려운 조건에서도 전경의 두드러짐을 향상시킨다. EGA 모듈은 저대비, 구조적 불연속성, 모호한 특징 응답 등 저해상도 이미지에서 흔히 발생하는 문제들을 효과적으로 완화하여, 계산 효율성을 유지하면서 모델의 강건성을 크게 향상시킨다. 다섯 가지 벤치마크(DOTA-v1.0, v1.5, DIOR-R, FAIR1M-v1.0, VisDrone2019)에서 실시한 종합적인 평가 결과, LEGNet은 저품질 객체 탐지에서 특히 최첨단 성능을 달성함을 입증하였다. 코드는 https://github.com/lwCVer/LEGNet 에서 공개되어 있다.