
关于海洋性或湖面终止型冰川的冰川裂解前沿(calving front)位置的精确信息,是分析当前冰川变化过程及评估其他变量(如前沿消融速率)的基础性参数。近年来,研究人员开始引入能够自动识别卫星影像中裂解前沿的算法。大多数研究采用光学影像,因其具有足够的空间分辨率以及多光谱波段,使冰川特征易于区分。然而,利用合成孔径雷达(SAR)影像检测裂解前沿具有重要优势:SAR影像可在极地夜期间获取,且不受天气条件(如云层覆盖)影响,因而可实现全球范围内的全年连续监测。本文介绍了一个基准数据集(Gourmelon et al., 2022b),该数据集包含来自全球多个区域的SAR影像及其对应的人工标注信息,明确标示了裂解前沿的位置(https://doi.org/10.1594/PANGAEA.940950)。借助该数据集,可实现不同裂解前沿检测方法的构建、测试与公平比较,从而确定最优技术路径。该数据集共包含681个样本,规模足以支持深度学习分割模型的训练。它是首个基于多任务卫星数据提供长期冰川裂解前沿信息的数据集。由于涵盖南极洲、格陵兰岛和阿拉斯加的冰川,基于该数据集训练和测试的模型具备广泛的适用性。测试集与训练集相互独立,确保了模型泛化能力的客观评估。本数据集提供两套标注:一套为二值分割标签,用于将裂解前沿与背景区分开;另一套为多类分割标签,用于区分不同的地表景观类别。与现有其他裂解前沿数据集不同,本数据集不仅包含标注信息,还提供预处理并地理配准后的SAR影像(以PNG格式存储),极大提升了数据的可访问性,有助于数据科学等跨领域研究者的参与。通过该基准数据集,不同裂解前沿检测算法之间的可比性得以建立,相关研究的可重复性也得到显著提升。此外,本文为每种标签类型提供了一个基准模型。两个模型均基于U-Net架构——目前最流行的深度学习分割网络之一。随后通过两种后处理流程,将分割结果转化为宽度仅为1像素的裂解前沿边界线。由于提供了两类标签,两种方法均可用于解决裂解前沿识别问题。为评估不同模型的性能,建议采用两步评价策略:首先,基于召回率(recall)、精确率(precision)、F1分数及Jaccard指数对分割结果进行定量分析;其次,通过计算分割结果与人工标注前沿之间的平均距离误差,评估裂解前沿边界线的精度。本文提出的基线模型在南极洲Mapple冰川上的平均距离误差为150 m ± 24 m,而在阿拉斯加Columbia冰川上则为840 m ± 84 m。后者裂解前沿结构更为复杂,包含多个独立段落,而前者则为横向约束良好、结构单一的裂解前沿,这一差异也体现在模型性能的差异上。