원격 감지 객체 탐지를 위한 대규모 선택적 커널 네트워크

최근 원격 탐사 객체 탐지에 관한 연구는 주로 방향성 경계 상자(oriented bounding boxes)의 표현력을 향상시키는 데 집중해왔지만, 원격 탐사 환경에서 고유하게 나타나는 사전 지식(prior knowledge)은 간과되어 왔다. 이러한 사전 지식은 유용할 수 있으며, 특히 미세한 원격 탐사 객체의 경우 충분한 장거리 맥락(context)을 참조하지 않을 경우 오류 탐지가 발생할 수 있기 때문이다. 또한 다양한 종류의 객체는 각각 다른 수준의 장거리 맥락을 필요로 한다. 본 논문에서는 이러한 사전 지식을 고려하여, 대규모 선택적 커널 네트워크(Large Selective Kernel Network, LSKNet)를 제안한다. LSKNet은 원격 탐사 환경에서 다양한 객체의 거리 맥락을 보다 효과적으로 모델링하기 위해, 동적으로 큰 공간적 수용 영역(spatial receptive field)을 조정할 수 있다. 알려진 바에 따르면, 본 연구는 원격 탐사 객체 탐지 분야에서 대규모 선택적 커널 메커니즘을 처음으로 탐색한 사례이다. 복잡한 기법 없이도 LSKNet은 표준 벤치마크에서 새로운 최고 성능을 기록하였으며, 각각 HRSC2016(98.46% mAP), DOTA-v1.0(81.85% mAP), FAIR1M-v1.0(47.87% mAP)에서 최고 성과를 달성하였다. 유사한 기술을 기반으로 2022년 광저우-홍콩-마카오 대만구 국제 알고리즘 경진대회에서 2위를 차지하였다. 코드는 다음 링크에서 공개되어 있다: https://github.com/zcablii/Large-Selective-Kernel-Network.