17일 전

SFA-Net: 원격 탐사 이미지 세그멘테이션을 위한 의미적 특징 조정 네트워크

{Sang Jun Lee, Jiwoo Jeong, Gyutae Hwang}
초록

심층 학습과 컴퓨터 비전 기술의 발전은 원격 탐사 분야에 큰 영향을 미쳐 토지 피복 분류 및 변화 탐지와 같은 응용 분야에서 효율적인 데이터 분석을 가능하게 하였다. 국소적 특징과 전역적 맥락을 분석하는 데 뛰어난 성능을 보이는 합성곱 신경망(Convolutional Neural Networks, CNN)과 트랜스포머 아키텍처는 시각 인식 알고리즘에 널리 활용되어 왔다. 본 논문에서는 CNN 기반 인코더와 트랜스포머 기반 디코더로 구성된 하이브리드 트랜스포머 아키텍처를 제안한다. 또한, 효율적인 네트워크(EfficientNet) 백본에서 추출한 다중 해상도 특징 맵을 정교화하기 위한 특징 조정 모듈을 제안한다. 조정된 특징 맵은 트랜스포머 기반 디코더에 통합되어 원격 탐사 이미지의 의미적 세그멘테이션을 수행한다. 본 논문에서는 제안된 인코더-디코더 아키텍처를 의미적 특징 조정 네트워크(Semantic Feature Adjustment Network, SFA-Net)라고 명명한다. SFA-Net의 효과성을 입증하기 위해 UAVid, ISPRS Potsdam, ISPRS Vaihingen, LoveDA 등 네 가지 공개 벤치마크 데이터셋을 대상으로 철저한 실험을 수행하였다. 제안된 모델은 원격 탐사 이미지 세그멘테이션에서 UAVid, ISPRS Vaihingen, LoveDA 데이터셋에서 최신 기술 수준의 정확도를 달성하였다. ISPRS Potsdam 데이터셋에서는 최신 모델과 비슷한 정확도를 기록하면서도 학습 가능한 파라미터 수를 113.8M에서 10.7M로 대폭 감소시켰다.