11일 전

전이란 과정이다: 매우 고해상도 원격 감지 이미지에 대한 페어 단위 비디오 변경 탐지 네트워크

{Hongyan zhang, Guangyi Yang, Manhui Lin}
초록

지구 관측 분야에서 중요한 과제이면서도 도전적인 과제인 변화 탐지(change detection, CD)는 딥러닝의 광범위한 적용과 함께 기술적 혁신을 겪고 있다. 그러나 기존의 딥러닝 기반 CD 기법들은 여전히 두 가지 주요한 문제에 직면해 있다. 첫째, 시간적 모델링의 부족이며, 둘째, 공간-시간 상호의존성(spatio-temporal coupling)이다. 이러한 문제들을 고려하여, 우리는 시간에 대한 보다 명시적이고 정교한 모델링을 제안하고, 이를 바탕으로 쌍-비디오 변화 탐지(pair-to-video change detection, P2V-CD) 프레임워크를 구축하였다. 먼저, 입력된 이미지 쌍에서 풍부한 시간 정보를 담고 있는 가상의 전이 비디오(pseudo transition video)를 생성함으로써, CD 문제를 비디오 이해(video understanding) 문제로 재정의한다. 이후, 공간적 및 시간적 전이 유형을 각각 독립적으로 인식할 수 있도록 두 개의 분리된 인코더를 활용하며, 이들 인코더는 횡방향 연결(lateral connection)을 통해 상호 보완적으로 작동하도록 설계된다. 더불어, 모델 학습을 가속화하기 위해 심층 감독(deep supervision) 기법을 도입하였다. 실험을 통해 P2V-CD 방법이 시각적 효과와 평가 지표 측면에서 기존 최첨단 CD 기법들과 비교해 우수한 성능을 보임을 입증하였으며, 모델 크기는 적당하고 계산량도 상대적으로 낮은 수준을 유지하고 있다. 광범위한 특징 맵 시각화 실험을 통해 본 연구 방법이 이시기 이미지 간의 대비를 넘어서 어떻게 변화를 이해하고 탐지하는지에 대한 메커니즘을 명확히 보여준다. 소스 코드는 다음 링크에서 제공된다: https://github.com/Bobholamovic/CDLab.

전이란 과정이다: 매우 고해상도 원격 감지 이미지에 대한 페어 단위 비디오 변경 탐지 네트워크 | 최신 연구 논문 | HyperAI초신경