청장고원의 데이터 부족 문제를 직접 해결하세요! 저장대학교 연구팀은 청해-티베트 고원의 표면 열 흐름 분포를 설명하기 위해 새로운 GeoAI 모델을 제안했습니다.

지구과학 연구에서 표면 열 흐름(SHF)은 지구 내부 깊은 곳의 열 에너지 방출을 나타내는 중요한 지표로서 항상 많은 주목을 받아왔습니다.표면 열의 흐름은 지구 내부를 움직이는 에너지를 보여주는 "창문"일 뿐만 아니라, 지각의 열 구조, 맨틀의 열역학, 지질 구조의 진화를 보여주는 핵심 매개변수이기도 합니다.표면 열 흐름에 대한 연구를 통해 우리는 지구 내부의 열적 메커니즘에 대해 더 깊이 이해하고, 판의 섭입, 맨틀 상승류, 균열 확장과 같은 지질학적 현상의 역동적 과정을 밝혀낼 수 있습니다.
지난 수십 년 동안 지표 열 흐름에 대한 연구는 많은 진전을 이루었지만, 특히 청해-티베트 고원과 같은 복잡한 지각대에서는 여전히 세계의 특정 지역에서 풀리지 않은 미스터리가 많이 남아 있습니다.
지구의 '제3극'인 청하이-티베트 고원은 거대한 지형 차이와 복잡한 구조적 특징으로 인해 지구 역학을 연구하는 자연스러운 실험실이 되었습니다. 인도판과 유라시아판이 충돌한 이후, 이 지역은 격렬한 지각 활동을 겪었고, 그 결과 다양한 지질 단위와 열적 이상이 나타났습니다. 최근 연구에 따르면청장고원의 지표 열류는 지리적 공간적 이질성이 크다. 열류 값이 높은 지역은 야를룽장보 봉합대와 남북 균열대에 집중되어 있는 반면, 다른 지역의 열류 분포는 비교적 낮다.그러나 측정 지점이 부족하고 적용 범위가 제한적이기 때문에 이 열 흐름 분포 법칙의 정량적 분석에는 여전히 큰 기술적 병목 현상이 존재합니다. 특히 지형이 험준하고 인적이 드문 지역에서는 전통적인 굴착 측정 방법 및 관측 장비를 사용하여 대규모로 수행하기 어려워 이러한 지역에서는 표면 열 흐름 데이터가 거의 없습니다.
이러한 문제를 해결하기 위해 저장대학교 지구과학부는 향상된 해석성을 갖춘 지리 신경망 가중 회귀 모형(EI-GNNWR)이라는 공간 지능화 방법을 제안했습니다.이 방법은 지구물리학 및 지질학 데이터의 공간적 이질성 특성을 통합하여 표면 열 흐름의 비선형 관계를 포착하고, 청장고원의 열 흐름 분포와 지구역학적 메커니즘에 대한 포괄적인 이해를 위한 새로운 연구 프레임워크와 기술 지원을 제공합니다.
관련 연구는 지구과학 분야에서 널리 알려진 학술지인 Journal of Geophysical Research: Solid Earth에 "데이터 기반 방법을 통해 밝혀진 티베트 고원의 지표 열 흐름 분포"라는 제목으로 게재되었습니다.
연구 하이라이트:
* 지질 구조 정보와 지구물리학 데이터를 완전히 고려하는 해석 가능성에 대한 데이터 기반 접근 방식이 제안됩니다: EI-GNNWR 모델
* EI-GNNWR 모델은 호주와 청해-티베트 고원의 표면 열 흐름 지도를 정확하게 예측합니다. 예측 정확도는 4대 주요 모델인 XGBoost, FCNN, OLR, GWR보다 상당히 높아, 청해-티베트 고원의 표면 열 흐름 데이터 부족을 효과적으로 보완합니다.
* EI-GNNWR 모델은 청해-티베트 고원의 표면 열 흐름 분포와 이에 영향을 미치는 메커니즘을 효과적으로 보여줍니다.

서류 주소:
https://doi.org/10.1029/2023JB028491
오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
티베트 고원 및 전 지구 표면 열 흐름 데이터 세트를 기반으로 한 모델 학습
연구진은 전 세계적으로 수집된 표면 열 흐름 데이터 세트, NGHF 육지 열 흐름 데이터 세트, 그리고 중국의 칭하이-티베트 고원 표면 열 흐름 데이터 세트를 병합하고, 해양 측정 데이터와 "D: 열 흐름 지도에 사용하지 않은 데이터"로 표시된 모든 측정 데이터를 제거하여 초기 데이터 세트를 구성했습니다.
중국 본토의 표면 열 흐름 데이터 세트의 주소는 다음과 같습니다.
청장고원의 측정 데이터 세트 수가 적기 때문에 기존 관측은 주로 고원의 가장자리에 집중되어 있으며, 내부 지역에 대한 이해는 제한적입니다. 따라서 연구자들은 주변 판의 표면 열 흐름 측정값을 통합하여 데이터 세트를 강화했습니다.

이 연구에서는 220개의 표면 열 흐름 측정 지점을 사용했으며, 그 중 90%는 모델의 훈련 및 검증 데이터 세트로 사용되었고, 10%는 테스트 데이터 세트로 사용되었습니다.모델의 정확성을 검증합니다. 연구진은 실험 정확도를 높이기 위해 모델 학습 및 검증 단계에서 교차 검증 기술을 채택했습니다.
또한 데이터가 부족한 청장고원의 표면 열 흐름 값을 예측하려면 이 값과 지구물리학적, 지질학적 특성 간의 관계를 맞춰야 합니다. 이를 위해 연구진은 아래 표에 나타난 것처럼 표면 열 흐름과 관련된 몇 가지 주요 특징을 선택했습니다.

GNNWR 모델을 기반으로 SHAP 값 계산 방법을 도입합니다.
청해-티베트 고원의 표면 열 흐름 측정 데이터는 비교적 제한적이며 상당한 공간적 비정상성을 보여줍니다.또한 아래 그림에서 보듯이 비모수적 국부 가중 산란 평활화(LOWESS) 추세선은 모호 깊이, 지형, 지각 단위, 젊은 균열까지의 거리, 표면 열 흐름과 같은 매개변수 간에 상당한 변동을 보여 표면 열 흐름과 지질학적, 지구물리학적 매개변수 간에 복잡한 비선형 관계가 있음을 나타냅니다.

이를 위해 연구진은 GNNWR 모델을 채택했습니다. 이 모델은 일반 선형 회귀(OLR)와 신경망 알고리즘을 결합하여 공간적 비정상성을 정확하게 포착하고, 표면 열 흐름과 지질 및 지구 물리학 데이터의 상관관계에 대한 강력한 회귀 프레임워크를 구축합니다.
GNNWR 모델의 해석성을 더욱 개선하고 표면 열 흐름 값에 대한 각 변수의 기여도를 정확하게 정량화하기 위해 연구진은 SHapley Additive exPlanations(SHAP) 값 계산 방법을 사용했습니다. 이러한 접근 방식을 사용하면 지역적 상호 작용을 정량화하고 특정 예측에서 개별 기능에 중요도 값을 할당하여 보다 자세하고 지역적으로 미묘한 차이가 있는 설명을 제공할 수 있습니다.이러한 통합적 접근 방식을 바탕으로 연구자들은 해석성이 향상된 지리적 신경망 가중 회귀 모델(EI-GNNWR)을 제안했습니다.
SHAP 관련 튜토리얼 주소:
https://go.hyper.ai/deK6H
EI-GNNWR 모델의 예측 정확도는 다른 모델보다 상당히 높습니다.
EI-GNNWR 모델의 효과를 테스트하기 위해 연구진은 지열 데이터가 광범위하고 정확한 호주 지역을 선택하여 검증했습니다.
호주 지역은 풍부하고 비교적 정확한 표면 열 흐름 측정을 통해 광범위한 지열 탐사의 중심지이므로 데이터 기반 접근 방식의 효과를 시험하기에 이상적인 장소입니다. 이를 바탕으로 연구진은 먼저 호주에서 모델 테스트를 실시하기로 결정하고 호주의 표면 열 흐름의 공간 분포에 대한 예측 결과를 네 가지 다른 모델의 결과와 비교했습니다.이러한 모델은 Extreme Gradient Boosting(XGBoost), Fully Connected Neural Network(FCNN), Ordinary Linear Regression(OLR), Geographically Weighted Regression(GWR) 모델입니다.
평가 결과는 아래 그림과 같습니다. EI-GNNWR 모델은 R² 값이 0.823으로 예측 성능이 우수했으며, 이는 각각 XGBoost, FCNN, OLR 및 GWR 모델보다 36%, 31%, 22% 및 4% 더 높습니다. 또한 정규화된 RMSE는 0.10에 불과해 XGBoost, FCNN, OLR, GWR 모델과 비교했을 때 각각 47%, 50%, 44.4%, 23%만큼 감소했습니다. 이 모델은 호주 지역의 XGBoost 모델의 이전 R² 값과 비교했을 때 17%만큼 향상되었습니다. 정규화된 RMSE도 이전에 보고된 값에 비해 55%만큼 감소했습니다.
* 모델의 R²은 모델의 적합성을 평가하는 데 사용되는 통계적 지표입니다. R²이 높을수록 모델의 적합도가 높아지고 예측 성능도 좋아집니다.
* RMSE(제곱평균제곱근오차)는 회귀모형의 예측오차를 평가하는 데 일반적으로 사용되는 지표입니다. 모델 예측값과 실제값 사이의 차이를 측정하는 데 사용됩니다. RMSE가 작을수록 모델 예측값이 실제 값에 더 가까워집니다.

(a) EI-GNNWR 모델
(b) GWR 모델
(c) XGBoost 모델
(d) FCNN 모델
(e) OLR 모델
지도의 원은 측정 지점을 나타내며, 인접한 산점도(f-j)는 측정된 표면 열 흐름 값과 모델 예측 값 간의 관계를 보여줍니다.
공간 지능 기법을 기반으로 청해-티베트 고원의 표면 열 흐름 분포를 밝히다
연구진은 호주에서 EI-GNNWR 방법의 효과를 검증한 후, 청해-티베트 고원과 주변 지역의 표면 열 흐름 측정 지점을 사용하여 새로운 모델을 훈련했습니다.
연구 결과에 따르면 이 모델은 R² 값이 0.91, 정규화된 RMSE가 0.07, 오차 수준이 7% 이내로 높은 예측 정확도를 갖는 것으로 나타났습니다. 연구진은 청해-티베트 고원의 표면 열 흐름(SHF) 분포 지도를 제작했습니다. 아래 그림에서 보듯이 청장고원의 평균 열유량 값은 66.2mW/m²로, 전 세계 평균인 62.8mW/m²보다 상당히 높습니다.세계에서 가장 격렬한 지각 활동이 일어나는 지역 중 하나인 청해-티베트 고원의 열 흐름은 고르지 않게 분포되어 있습니다. 고온의 흐름이 심한 지역은 주로 남쪽, 북동쪽, 남동쪽에 집중되어 있으며, 특히 고원의 북동쪽 경계인 야르룽장보 봉합대와 서부 윈난성의 텅충 지역에 집중되어 있습니다.

지열 형성 결정 요인을 더 잘 이해하기 위해 연구진은 EI-GNNWR 모델에서 SHAP 값의 공간 분포를 분석했습니다(아래 그림 참조). 이때 지질학적 및 지구물리학적 변수의 역할에 초점을 맞췄습니다. 이러한 접근 방식은 각 변수가 표면 열 흐름 형성에 구체적으로 어떻게 기여하는지 파악하고 이러한 변수와 지열 활동 간의 관계를 명확히 합니다.
연구진은 청해-티베트 고원 남서부의 열 흐름 패턴에 초점을 맞춰 지열 에너지 생산을 형성하는 지질학적 및 지구물리학적 요인의 상호 작용을 탐구했습니다.예를 들어 야를룽장보강과 누장강 사이 지역(아래 그림의 Ⅰ번 지역)을 살펴보면, 예측된 표면 열 흐름 값은 90 mW/m²를 초과합니다. SHAP 값은 능선으로부터의 거리와 중력 평균 곡률이 표면 열 흐름의 증가에 긍정적인 영향을 미친다는 것을 나타내며, 이는 히말라야 조산대의 국부적 융해와 높은 표면 열 흐름 값과 일치합니다. 중력 평균 곡률은 지열 이상 현상의 형성에 상당한 영향을 미치며, 특히 지진 속도가 낮은 조산대의 융해대에서 큰 영향을 미칩니다.
아래 그림의 II 영역에서는 표면 열 흐름 값이 상당히 높은데, 이는 능선의 근접성과 지형적 복잡성과 밀접한 관련이 있습니다. 젊은 지각 영역의 능선은 맨틀 물질의 상승을 통해 표면 열 흐름 값에 영향을 미칩니다. 동시에 지형적 변화는 지열 분포와 강도를 형성하여 해당 지역에서 독특한 지열 패턴을 형성합니다.

GNNWR을 기반으로 다양한 분야의 지구과학 응용 분야에 도움이 됩니다.
2020년, 저장대학교 지구과학부의 연구진은 복잡한 지리적 과정을 통해 다양한 영역에서 공간적 비정상성을 해결하기 위한 모델인 지리 신경망 가중 회귀(GNNWR)를 제안했습니다.연구진은 이 모델을 바탕으로 해양학, 지리학, 대기과학, 지질학 및 기타 분야에서 사용할 수 있는 일련의 모델을 제안했으며, 관련 논문 30편 이상을 발표했습니다.
서류 주소:
https://www.tandfonline.com/doi/full/10.1080/13658816.2019.1707834
GNNWR 오픈소스 주소:
https://github.com/zjuwss/gnnwr
구체적으로,주택가격 분석 분야에서는추상적인 "공간적 근접성"으로는 손실 함수를 구성할 수 없고 신경망을 훈련하기 어렵다는 문제를 해결하기 위해 연구진은 OSP와 GNNWR을 결합하여 osp-GNNWR 모델을 구축했습니다. 우한의 주택 가격에 대한 시뮬레이션 데이터 세트와 실증적 사례를 연구한 결과, 이 모델은 전 세계적으로 더 나은 성능을 보이며 복잡한 공간적 과정과 지리적 현상을 더 정확하게 설명할 수 있음이 입증되었습니다.
자세한 보고서를 읽으려면 클릭하세요: 우한 주택 가격에 대한 정확한 예측! 저장대학교 GIS 연구실은 osp-GNNWR 모델을 제안했습니다. 이는 복잡한 공간 과정과 지리적 현상을 정확하게 설명합니다.
대기과학 분야에서는GNNWR 모델은 공간적으로 비정상적 회귀 관계를 확립하고, PM2.5 농도를 추정하고, 전국에 걸쳐 고정밀이고 상당히 자세한 PM2.5 분포를 제공할 수 있습니다. 예를 들어, 지리공간 모델링을 통해 우리는 PM2.5 농도가 베이징에서 롄윈강까지 전반적으로 높다는 것을 발견했는데, 이는 풍향과 풍속과 같은 요인의 영향을 받을 수 있습니다. 또한 특정 지역의 방풍림은 PM2.5의 확산을 억제할 수 있습니다.
관련 논문은 “공간 신경망 가중 회귀를 통한 중국의 VIIRS IP AOD를 이용한 고해상도 지상 수준 PM(2.5)의 위성 기반 매핑”이라는 제목으로 MDPI에 게재되었습니다.
서류 주소:
https://www.mdpi.com/2072-4292/13/10/1979
지질학 분야에서는특히 금광의 공간적 분포 예측에 있어서 GNNWR 모델은 공간적 패턴과 신경망을 통합하고, 샤플리의 가법적 해석 이론과 결합하여 예측의 정확도를 크게 향상시킬 수 있을 뿐만 아니라 복잡한 공간 시나리오에서 광물 예측의 해석성도 개선할 수 있습니다.
자세한 보고서를 보려면 클릭하세요: 저장대학교 Du Zhenhong 팀이 제안한 GNNWLR 모델은 5개의 고급 모델보다 우수합니다. 광화 예측 정확도 향상
해양 생태환경 모델링 측면에서,연구진은 푸리에 분석과 트랜스포머 신경망을 결합하고 시계열 분해 아키텍처를 채택하여 CHL-A 농도 예측의 정확도를 효과적으로 개선하는 새로운 딥러닝 예측 모델인 ChloroFormer를 제안했습니다. 또한 연구진은 두 개의 다른 해안 연구 지역에서 실험을 수행했습니다. 실험 결과에 따르면, 제안된 모델은 다단계 예측 정확도 측면에서 다른 6가지 비교 모델보다 성능이 뛰어났을 뿐만 아니라 극심하고 빈번한 조류 개화 상황에서도 상대적 우위를 유지했습니다.
자세한 보고서를 보려면 클릭하세요: 딥러닝이 해양 적조 위기에 맞서 싸웁니다! 저장대학교 GIS 연구실은 해양 조류 발생에 대한 조기 경보를 제공할 수 있는 ChloroFormer 모델을 제안했습니다.
앞으로 팀은 GIS 이론과 방법, 지구과학적 지능형 분석 플랫폼 기술을 본격적으로 개발하고 GeoAI 개발을 지속적으로 모색할 것입니다.
GNNWR 연구팀 리더인 우 센센의 개인 홈페이지와 시공간 지능 회귀 모델에 대한 간략한 소개:
https://mypage.zju.edu.cn/wusen