17일 전

고해상도 원격 감지 이미지의 의미 분할을 위한 다중 주의망

{Peter M. Atkinson, Libo Wang, Jianlin Su, Chenxi Duan, Ce Zhang, Shunyi Zheng, Rui Li}
초록

원격 탐사 이미지의 의미 분할은 토지 자원 관리, 생태계 모니터링, 도시 계획 등 다양한 응용 분야에서 중요한 역할을 한다. 심층 합성곱 신경망의 발전으로 원격 탐사 이미지의 의미 분할 정확도는 크게 향상되었지만, 기존 표준 모델에는 몇 가지 제약 사항이 존재한다. 첫째, U-Net과 같은 인코더-디코더 아키텍처에서는 다중 해상도 특징의 활용이 부족하여, 저수준 특징과 고수준 특징이 정교화 없이 직접 연결되는 경우가 많다. 둘째, 특징 맵의 장거리 의존성은 충분히 탐색되지 않아 각 의미 클래스와 관련된 최적의 특징 표현이 이루어지지 않는다. 셋째, 점곱 주의(attention) 메커니즘이 의미 분할에 도입되어 장거리 의존성을 모델링하고는 있으나, 주의 메커니즘의 높은 시간 및 공간 복잡도로 인해 대규모 입력을 다루는 실제 응용 환경에서의 주의 기반 접근은 제한적이다. 본 논문에서는 여러 효율적인 주의 모듈을 통해 맥락적 의존성을 추출함으로써 이러한 문제들을 해결하기 위한 다중 주의망(Multi-Attention Network, MANet)을 제안한다. 특히, 선형 복잡도를 가지는 새로운 주의 메커니즘인 커널 주의(Kernel Attention)를 도입하여 주의 메커니즘의 높은 계산 부담을 완화하였다. 커널 주의와 채널 주의를 기반으로, ResNet-50을 통해 추출한 국소 특징 맵과 그에 해당하는 전역 의존성을 통합하여 상호의존적인 채널 맵을 적응적으로 재가중한다. 대규모 고해상도 원격 탐사 데이터셋 두 개에 대한 수치 실험을 통해 제안된 MANet이 우수한 성능을 보임을 입증하였다. 코드는 https://github.com/lironui/Multi-Attention-Network 에서 제공된다.

고해상도 원격 감지 이미지의 의미 분할을 위한 다중 주의망 | 최신 연구 논문 | HyperAI초신경