
초록
고광역 영상 분류는 광역 스펙트럼 연속체에 포함된 시각 정보를 포착할 수 있는 능력 덕분에 원격 탐사 분야에서 고정밀 비전 작업에 점점 더 주목받고 있다. 연구자들은 최근 고광역 영상 분류의 자동화를 위해 노력해 왔으며, 특히 비전 트랜스포머(Vision-Transformers)를 활용한 연구가 활발히 진행되고 있다. 그러나 대부분의 기존 모델은 스펙트럼 정보에만 초점을 맞추며, 이웃 픽셀(즉, 국소성)에 대한 고려가 부족하여 분류 능력이 충분히 구분되지 않아 성능에 한계가 있다. 이를 해결하기 위해 본 연구는 세 가지 주요 기여를 제안한다. 첫째, 국소적 정보와 스펙트럼 정보를 동시에 모델링하는 고광역 국소 인지 이미지 트랜스포머(HyLITE)를 도입한다. 둘째, 국소에서 전역으로의 정보 통합을 촉진하는 새로운 정규화 함수를 제안한다. 셋째, 제안한 방법은 기존의 주요 대안 모델들을 상회하며, 정확도에서 최대 10%까지 향상된 성능을 달성한다. 학습된 모델과 소스 코드는 HyLITE 공식 홈페이지에서 공개되어 있다.