警惕城市「慢性病」:中南大学柳建新教授团队,用 AI 预测未来 40 年的地面沉降风险

特色图像

2023 年 5 月,天津市津南区八里台镇凤锦庭院的业主「胆战心惊」,从远处看,自己家 25 层高的楼房「好像歪了」。更让业主们恐慌的是,不仅楼房周边的草地、路面开始沉降开裂,甚至楼地基也出现了数十厘米的沉降和裂缝,部分地下停车场也出现了墙体裂痕和渗水情况,导致上千名业主无法归家。

事实上,地面沉降 (LS) 现象已经屡见不鲜。早在 2012 年,由国土资源部、水利部会同国家发改委、财政部等十部委联合编制的中国首部《全国地面沉降防治规划(2011-2020 年)》就指出,目前全国遭受地面沉降灾害的城市超过 50 个,分布于北京、天津、河北、山西、内蒙古等 20 个省区市。

除此之外,联合国教科文组织地面沉降工作组在 2021 年发表于 Science 上的研究也警示称,到 2040 年,地面沉降将威胁全球近 1/5 的人口。可见,如何实现地面沉降的快速监测和精确模拟已经成为目前城市发展的首要难题。

为了解决这一难题,来自中南大学地球科学与信息物理学院的柳建新教授团队,联合广东省地质环境监测总站、广东省第四地质大队、科特迪瓦博瓦尼大学,在国际环境科学与生态学学术期刊 Journal of Environmental Management 上发表了城市地面沉降智能化预测的研究成果,率先使用极端梯度提升回归器 (eXtreme Gradient Boosting Regressor, XGBR) 和长短期记忆 (Long Short-Term Memory, LSTM) 网络在城市地区进行地面沉降建模,不但解决了单模型框架在处理复杂场景时固有的局限性,并且通过数据驱动的策略为防灾减灾和土地利用策略提供了有效的预测手段。

研究亮点

* 通过使用 Taylor 图,证明了 XGBR 和 LSTM 模型与沉降数据之间具有很强的相关性,以及预测准确性

* 利用 InSAR 、地质和钻孔数据估计地表活跃性的变化速度,从而揭示影响地表活跃性的关键变量

* 通过数据驱动的策略促进主动的土地利用管理,为可持续城市发展和资源管理实践奠定基础

论文地址:
https://doi.org/10.1016/j.jenvman.2024.120078
关注公众号,后台回复「地面沉降」获取完整 PDF

研究范围:聚焦南沙区,探寻珠三角地区土地沉降风险

珠三角地区的沉降面积达到 11,397 平方公里,沉降幅度普遍超过 500 毫米,最高可达 1,000 毫米以上。其中,南沙区位于广州市最南端,是西江、北江和东江的交汇点,总面积约 803 平方公里。从岩性来看,南沙区主要分布为棕红粘土、淡黄色砾石、中粗砂、斑状粘土、灰白色、棕红色砾石等软土沉积。从水文地质条件来看,南沙区地下水可分为无承压和承压两大含水层。

随着珠三角地区的快速发展,南沙区在城市的快速发展过程中不仅限于地表发展,还加大了对地下水的采集,这种开采导致地下水位下降。同时,高层建筑和工业设施的增多,也进一步对地表增压,加剧了地面沉降的产生。

通过对工程和水文地质钻探在内的岩土调查表明,南沙区地面沉降经历了四个不同的阶段:起步阶段 (2015-2016 年,-125mm) 、发展阶段 (2016-2018 年,-170mm) 、扩张阶段 (2018-2020 年,-222mm) 、快速发展阶段 (2020-2022 年,-320mm),这些阶段与城市发展和基础设施建设基本一致。

南沙区地理位置

数据集:SAR 与地质数据并举,全方位还原当地地质信息

该研究的 SAR (Synthetic Aperture Radar,合成孔径雷达) 图像数据采用的是欧洲航天局哥白尼计划 (GMES) 的哨兵 1 号卫星。

这是一种有源微波遥感卫星,由 Sentinel-1A 和 Sentinel-1B 两颗卫星组成,两颗卫星携带的传感器可在昼夜及各种天气情况下提供连续图像。从 2015 年 6 月 15 日到 2022 年 12 月 23 日,Sentinel-1 携带了 c 波段合成孔径雷达,共拍摄了 213 个场景。研究人员将 SAR 数据与每年通过控制点收集的实际数据进行了交叉核对。

南沙区 LS 情况统计

为了更好了解南沙区的综合地质及钻井数据,该研究还对当地的土壤特性、地下水水位等进行了分析:

* 地质资料:通过对广东省地质局的地质系统信息进行收集,南沙区可被分为第三纪、白垩纪、侏罗纪、三叠纪、二叠纪、石炭纪、泥盆纪和志留纪 8 个地质时期。

* 填土厚度 (FSt) 和砂层分布 (SLd):不同的土壤会导致不同的沉降,该研究通过从不同时期的工程钻井中精心收集填土厚度 (FSt) 和砂层分布 (SLd) 的数据,从而有效评估南沙区的地下地面条件。

* 建筑密度 (BC):通过分析广东省地质局在 2015 年至 2022 年期间大型建筑,并基于建筑结构的综合土木工程数据得出南沙区的建筑密集度 (BC),从而深入探索这个人口稠密地区的城市基础设施密度与地面沉降之间的关系。

* 地下水位 (GWL):根据广东省所有钻探的综合结果绘制的地下水位图,该研究还通过水文地质钻探得到了南沙区有关地下水存在、深度、数量和质量的数据。

南沙区地质特性数据

研究方法:集成 InSAR 与机器学习,采用 Δr 策略拟合变量

该研究被结构化为一个简短的 SAR 数据处理步骤概述和基于机器学习的集成技术。

由于大气延迟、轨道残差和去相关噪声的影响,干涉合成孔径雷达技术 (Interferometric Synthetic Aperture Radar, InSAR) 只能在两个成像周期内测量地表变形,无法测量随时间变化的变形。为了降低大气延迟的影响,目前主流的时间序列 InSAR 方法可分为永久散射体干涉测量法 (PS-InSAR) 和小基线子集法 (SBAS-InSAR) 。 PS-InSAR 技术在很大程度上克服了去相干噪声等因素的影响。 SBAS-InSAR 技术可以最大限度地利用现有 SAR 数据进行高速精确的地表形变反演。

该研究的机器学习模型由极端梯度提升回归 (XGBR) 和长短期记忆网络 (LSTM) 共同组成。


其中,XGBR 是用于回归任务梯度增强算法的一种变体,能够通过随机抽样过程生成多样化的训练数据集;LSTM 架构旨在解决传统递归神经网络在捕获和学习长期关系方面的限制,能够在整个时间间隔内有效管理和保留信息。

基于上述方法,该研究首先通过分析 SAR 影像来获取主要数据集。从 2015 年 6 月到 2022 年 12 月,哨兵 1 号卫星共收集到 225 个场景作为 SAR 图像。其次,研究人员用 PS-InSAR 技术处理了 2015 年 6 月至 2019 年 11 月期间获得的 144 幅图像,其中 2018 年 12 月拍摄的图像作为主图像;然后,研究人员用 SBAS-InSAR 技术处理了 2019 年 1 月至 2022 年 12 月期间捕获的 66 张图像。最后,利用 PS-InSAR 和 SBAS-InSAR 监测结果,以 2015 年 6 月- 2019 年 11 月的累计沉降数据作为变形序列基准,对 2015 年 6 月- 2022 年 12 月的累计变形变量进行时间序列融合。

接下来,该研究专注于提取地下水位 (GWL) 数据,这是理解地下水动态对地表形态影响的关键步骤。该研究根据 2015 年 6 月至 2018 年 12 月整个广东省进行的水文地质钻探绘制了含水层地图。该地图是根据两个含水层的每个井眼收集的信息绘制的。然后,该研究利用 Golden Software Surfer 25.1 对水文地质数据进行分析,进而利用 ArcGIS Pro 1.2 进行栅格化处理。

最后,该研究深入探讨了采用先进机器学习算法的 delta rate(Δr)策略,以解释和进一步分析数据。为了拟合同一时间尺度的所有变量,该研究使用 delta rate (Δr) 计算并将其应用于除了分类特征 Lith 之外的所有数据,将两种不同的技术应用于 LSTM 和 XGBR 来解决这些问题。在 LSTM 中,该研究直接在 LSTM 网络中实现 Lasso 回归 (L1 正则化),通过向损失函数 Las 中添加相当于系数绝对值大小的惩罚项,以减少特定特征的影响。在 XGBR 中,该研究可以通过控制树的深度来限制模型的复杂性,从而间接影响特征的重要性。

研究结果:XGBR 相较 LSTM 模型更优

通过分析南沙区 2015-2022 年的时空格局 (spatial and temporal patterns),该研究计算了南沙区在不同时间段内的地面沉降或变形情况。

* 2015 年 6 月—12 月:南沙区无变形信号,最大累计沉降为 -21 mm,土地和建筑都很稳定。 

* 2015 年—2016 年:南沙区多处街道周边发生了较大变形,最大累计沉降量达 -64 mm 。
* 2015 年—2017 年:南沙区东南侧的变形最为严重,最大累积沉降量为 -128 mm 。 

* 2015 年—2018 年:南沙区的最大累积沉降量为 -176 mm 。
* 2015 年—2019 年:南沙区的最大累积沉降量为 -225 mm 。 

* 2015 年—2020 年:南沙区西侧变形明显,最大总沉降量为 -263 mm 。
* 2015 年— 2021 年:许多社区都出现了大面积的变形信号,最高累积沉降量达到 -320 mm 。 

* 2015 年— 2022 年:最大累积沉降量为 -364 mm 。

南沙区 InSAR 地图

该研究通过使用 XGBR 和随机森林 (RF) 评估不同特征的重要性。两个模型都表明,地下水位和建筑密度是对地面沉降影响最大的因素,其重要性累积在 51% 左右。紧接着,该研究利用平均 Δr 建立了地面沉降预测模型,通过将地下水位和建筑密度降低 80%,尝试解决下沉问题。

结果表明,降低地下水位和建筑密度可以显著降低地面沉降率。此外,XGBR 和 LSTM 模型的预测结果可能存在细微差异。实际上,XGBR 可以更好地捕获突发变化,而 LSTM 可以更好地捕获长期依赖关系。

LS 仿真过程中的特征贡献

该研究进一步用 XGBR 和 LSTM 模拟预测截至 2060 年的沉降数据。结果表明:

* 到 2024 年,XGBR 预测沉降量相对较小,大部分面积小于 -250 mm; 

* 到 2030 年,地面沉降累积更加明显,并在此后逐渐恶化;
* 到 2060 年,部分地区的沉降数据将超过 -450mm 。

整体而言,LSTM 的预测趋势与 XGBR 一致,但严重程度整体偏小。

使用 Δr 进行
2024 、 2030 、 2040 和 2060 年的 LS 模拟

该研究在测试阶段,使用 RMSE 、 MAE 和 R² 来根据归一化地下水位评估模型的性能。

结果表明,XGBR 的预测值与实际值非常接近,并且能够捕捉到更多可变性。此外,LSTM 的平均预测误差比 XGBR 更大,平均预测精度较低。同时,泰勒图 (Taylor diagram) 也表明,两种模型都与观测数据有很高的相关系数,但 XGBR 模型与地面沉降的相关性和标准差更接近于一致。

此外,该研究还表明,随着地下水位和建筑密度所带来的地面沉降风险被有效降低,未来的地表下沉程度可被有效控制。如不采取任何措施,到 2040 年,地面沉降风险将可能比研究预测的更为严重。

地面沉降:一种遍布全国的地质灾害现象

尽管地面沉降已经得到包括柳建新教授在内的科研人员高度重视,但人工智能在相关领域的研究仍然处于早期阶段,亟需注入更多力量。

中国地质调查局公布的《华北平原地面沉降调查与监测综合研究》及《中国地下水资源与环境调查》显示,华北平原不同区域的沉降中心有连成一片的趋势;长江区最近 30 余年累计沉降超过 200 毫米的面积近 1 万平方公里,占区域总面积的 1/3 。其中,上海市、江苏省的苏州、无锡、常州三市开始出现地裂缝等地质灾害。不仅如此,包括西北、华南等更多地方正处于缓慢地陷的长期困扰之中。

地下水透支会产生多种不利影响,包括地面沉降和永久性地下水储存损失。 2023 年 10 月,Nature Communications  期刊上发表的最新研究表明,全球每年约有 17 立方公里的地下水储存能力消失,这导致地面下沉和地下水储量永久性减少。研究人员预测,美国、中国和伊朗是地下水储量损失最严重的国家,也将是未来地面沉降的「重灾区」。

如今,通过利用机器学习和综合数据集,以及基于随机森林算法的机器学习方法,研究人员能够更深入地了解过度抽取地下水带来的环境挑战,并强调需要采取积极措施保护水资源和减轻地面沉降影响。然而,正如本文的研究一样,人工智能预测只是带来一种指导方向,能否真正缓解该区域内的地下水危机与地面建筑密度才是治本之策。