
초록
세분화(Semantic segmentation)는 방대한 양의 데이터를 처리하면서 고수준의 특징을 학습할 수 있는 접근법을 요구한다. 컨볼루션 신경망(CNN)은 이러한 목적을 달성하기 위해 고유하고 적응형 특징을 학습할 수 있다. 그러나 원격 탐사 이미지의 크기가 크고 공간 해상도가 높기 때문에 기존의 CNN은 전체 장면을 효율적으로 분석하기 어렵다. 최근 들어 딥 트랜스포머(Deep transformers)는 이미지 내 다양한 객체 간의 전역적 상호작용을 효과적으로 기록할 수 있음이 입증되었다. 본 논문에서는 컨볼루션 신경망과 트랜스포머를 결합한 새로운 세분화 모델을 제안하며, 국지적 특징 추출과 전역적 특징 추출 기법의 융합이 원격 탐사 세분화 작업에서 상당한 이점을 제공함을 보여준다. 또한 제안된 모델은 다중 모달 입력과 출력을 효율적으로 표현하기 위해 두 개의 융합 레이어를 포함하고 있다. 입력 융합 레이어는 이미지 콘텐츠와 고도 지도(DSM) 간의 관계를 요약하는 특징 맵을 추출한다. 출력 융합 레이어는 새로운 다중 작업 세분화 전략을 사용하며, 각 클래스별 특징 추출 레이어와 손실 함수를 활용하여 클래스 레이블을 식별한다. 마지막으로, 미분-진행법(fast-marching method)을 사용하여 미식별 클래스 레이블을 가장 가까운 알려진 이웃으로 변환한다. 실험 결과, 제안한 방법론이 최첨단 기술 대비 세분화 정확도를 향상시킴을 입증하였다.