SARATR-X: SAR 타겟 인식을 위한 기초 모델 구축으로 나아가기

합성(aperture) 레이더 자동 표적 인식(SAR ATR) 분야에서 놀라운 진전이 있었음에도 불구하고, 최근 연구들은 특정 카테고리(예: 차량, 선박, 항공기, 건물 등)의 탐지 및 분류에 주력하고 있다. 최고 성능을 보이는 SAR ATR 기법들의 핵심적인 제약 중 하나는, 감독 학습(supervised learning), 작업 특화(task-specific), 제한된 카테고리, 폐쇄세계(closed-world) 학습이라는 학습 패러다임에 의존한다는 점이다. 이러한 방식은 전문 SAR 분석가들이 비용이 많이 드는 방식으로 정밀하게 레이블링된 대량의 데이터에 의존하며, 일반화 능력과 확장성 측면에서 한계를 지닌다. 본 연구에서는 SAR ATR를 위한 기반 모델(foundation model) 구축에 대한 최초의 시도를 수행하였으며, 이를 SARATR-X라 명명하였다. SARATR-X는 자기지도 학습(self-supervised learning, SSL)을 통해 일반화 가능한 표현을 학습하며, 다양한 SAR 표적 탐지 및 분류 작업에 대해 레이블 효율적인 모델 적응을 위한 기반을 마련한다. 구체적으로, SARATR-X는 현재의 주요 벤치마크들을 통합하여 수집한 총 18만 개의 레이블 없이 처리된 SAR 표적 샘플을 기반으로 훈련되었으며, 지금까지 공개된 최대 규모의 데이터셋을 구성한다. SAR 이미지의 특성을 고려하여 SAR ATR에 최적화된 백본(Backbone) 아키텍처를 세심하게 설계하였고, 다중 스케일 기울기 특징을 갖춘 이단계 자기지도 학습 방법을 도입하여 특징의 다양성과 모델의 확장성을 보장하였다. SARATR-X의 성능은 소수 샘플(few-shot) 설정 및 강건성(robustness) 환경에서의 분류, 다양한 카테고리와 장면에서의 탐지에 대해 평가되었으며, 기존의 완전 감독, 반감독, 또는 자기지도 학습 알고리즘과 비교해도 경쟁력 있는 성능을 보이며 때로는 이를 능가하는 결과를 얻었다. 본 연구에서 개발한 SARATR-X 및 수집된 데이터셋은 https://github.com/waterdisappear/SARATR-X에 공개되어 SAR 이미지 해석을 위한 기반 모델 연구를 촉진할 것으로 기대된다.