캘빙 프론트와 그 위치: 합성 항공기 레이더 영상에서 자동으로 빙하 캘빙 프론트를 추출하기 위한 기준 데이터셋 및 방법론

해안 또는 호수 종단을 가진 빙하의 융기 front(융기 전면) 위치에 대한 정확한 정보는 지속적인 빙하 변화 과정을 분석하고, 전면 융기 속도와 같은 다른 변수를 평가하는 데 있어 핵심적인 빙하 변수이다. 최근 들어 연구자들은 위성 영상에서 융기 front를 자동으로 탐지할 수 있는 알고리즘을 도입하기 시작했다. 대부분의 연구는 광학 영상(옵티컬 이미지)을 사용하는데, 이는 높은 공간 해상도와 다양한 스펙트럼 대역이 존재하기 때문에 빙하 특징을 명확히 구분할 수 있기 때문이다. 그러나 합성 입자 레이더(SAR, Synthetic Aperture Radar) 영상에서 융기 front를 탐지하는 것은 매우 바람직하다. SAR 영상은 극야 기간에도 촬영이 가능하며 기상 조건(예: 구름)에 영향을 받지 않기 때문에 전 세계적으로 연중 통합 모니터링이 가능하다. 본 논문에서는 다수의 글로벌 지역에서 수집한 SAR 영상과 함께 수작업으로 정의된 융기 front 위치 정보를 제공하는 벤치마크 데이터셋(Gourmelon 등, 2022b)을 제시한다(https://doi.org/10.1594/PANGAEA.940950). 이 데이터셋을 통해 다양한 융기 front 탐지 방법을 구현하고 테스트하며, 성능을 공정하게 비교함으로써 가장 효과적인 접근법을 도출할 수 있다. 데이터셋은 681개의 샘플로 구성되어 있으며, 딥러닝 세그멘테이션 모델의 훈련에 충분한 규모를 갖추고 있다. 이는 다중 미션 데이터를 활용한 장기적인 빙하 융기 front 정보를 제공하는 최초의 데이터셋이다. 데이터셋에는 남극, 그린란드, 앨라스카의 빙하가 포함되어 있어, 이 데이터셋을 기반으로 훈련 및 테스트된 모델의 광범위한 적용 가능성을 보장한다. 테스트 세트는 훈련 세트와 독립적이므로 모델의 일반화 능력을 평가할 수 있다. 우리는 두 가지 유형의 라벨을 제공한다. 하나는 배경과 구분되는 융기 front를 식별하기 위한 이진 세그멘테이션 라벨이며, 다른 하나는 다양한 지형 클래스를 다중 클래스 세그멘테이션하기 위한 라벨이다. 기존의 융기 front 데이터셋과 달리, 본 데이터셋은 라벨뿐만 아니라 사전 처리 및 지리적 참조가 완료된 SAR 영상(파일 형식: PNG)도 포함하고 있다. 이 데이터셋에 대한 접근성 향상은 데이터 과학 등 타 분야의 과학자들이 전문 지식을 기여할 수 있도록 한다. 본 벤치마크 데이터셋을 통해 다양한 전면 탐지 알고리즘 간의 비교 가능성을 확보하고, 전면 탐지 연구의 재현성을 향상시킬 수 있다. 더불어, 각 라벨 유형에 대해 하나의 베이스라인 모델을 제시한다. 두 모델 모두 가장 인기 있는 딥러닝 세그멘테이션 아키텍처 중 하나인 U-Net 기반으로 구축되었다. 이후 두 가지 후처리 절차를 통해 세그멘테이션 결과를 1픽셀 폭의 전면 윤곽선으로 변환한다. 두 가지 라벨 유형을 제공함으로써, 두 가지 접근 방식 모두 문제 해결에 활용할 수 있다. 다양한 모델의 성능을 평가하기 위해, 먼저 재현율(recall), 정밀도(precision), F1 점수, 그리고 Jaccard 지수를 활용해 세그멘테이션 결과를 검토하는 것을 제안한다. 두 번째로는 라벨된 전면과의 평균 거리 오차를 계산하여 전면 윤곽선을 평가한다. 제시된 베이스라인 모델은 남극의 Mapple 빙하에 대해 평균 거리 오차 150 m ± 24 m, 앨라스카의 Columbia 빙하에 대해 840 m ± 84 m의 성능을 보였다. 이는 Columbia 빙하가 Mapple 빙하보다 더 복잡한 융기 전면 구조(다수의 섹션으로 구성됨)를 가지며, 수평 방향으로 잘 제약된 단일 전면을 가진 Mapple 빙하와 대비되는 특징을 반영한다.