해양 저산소 해체: 저장대학교 GIS 연구실, 머신 러닝과 위성 매핑을 통합하여 전 세계 해수면 용존산소에 대한 포괄적인 모델링 프레임워크 출시

수년 전, 해양 전문가 에릭 프린스는 어류 태그를 추적하던 중 이상 현상을 발견했습니다. 블루 마를린은 보통 미국 남동부에서 사냥을 위해 800m 깊이까지 잠수하지만, 코스타리카 해역에서는 바다 표면으로만 움직였습니다.다이빙 전문가인 마를린이 갑자기 다이빙을 멈춘 이유는 무엇일까?오랫동안 청새치를 연구해 온 에릭 프린스는 이 변칙 현상을 조사하기로 결심했습니다.
사실 이는 해양 환경의 변화에 직면한 해양 생물의 자기 보호 반응이며, 이번 에릭 프린스의 탐사로 인해 그 이면에 있는 '해양 저산소증' 현상이 대중의 관심을 더욱 끌게 되었습니다.코스타리카 심해의 산소 함량이 감소하고 산소 결핍 지역이 점차 확대되고 있기 때문에 청새치는 질식을 피하기 위해 표면으로 이동해야 합니다.
산소 부족으로 인해 많은 해양 생물이 죽은 해역을 일반적으로 바다의 "죽음의 구역"이라고 합니다.하지만 실제로 해양 저산소증의 부정적인 영향은 해양 생물 자체에만 영향을 미치는 것이 아니라 어업과 사회 경제에도 영향을 미칩니다.오늘날 지구 환경 문제가 심화됨에 따라 해양 저산소증이 점점 더 심각해지고 있습니다.
세계자연보전연맹(IUCN)은 2019년 해양 저산소 보고서에서 현재 산소 농도가 낮은 해양 지역이 확장되고 있다고 밝혔습니다. 1960년대에는 저산소 해역이 45개였지만, 현재는 저산소 상태에 영향을 받는 지역이 600개가 넘습니다. 보고서는 같은 기간 동안전 세계 해양에서 산소가 고갈된 물의 양은 4배나 증가했습니다.
해양 생태계의 건강을 유지하고 어업 자원을 보호하기 위해서는 해양 용존산소 수치를 과학적으로 측정하는 것이 중요합니다.
그러나 현재 해양 현장 관측의 비용이 높고, 기존 관측 데이터가 우주에 고르지 않게 분포되어 있으며, 용존산소 농도를 측정하는 방법도 다양하기 때문에 얻어지는 데이터의 질도 매우 다양합니다. 이 모든 것들은 지구 해양의 용존산소 수치 변화에 대한 연구에 특정한 과제를 가져왔습니다.
이에 대응하여 저장대학교 GIS 연구실의 연구자들은 머신 러닝 기술과 위성 제품을 결합한 새로운 방법을 제안했습니다.포괄적인 전 세계 해수면 용존산소 모델링 프레임워크인 DOsurface-Pred Framework를 개발하였고, 이 프레임워크를 기반으로 2010년부터 2018년까지의 기간을 포괄하는 대규모 해수면 용존산소 데이터세트인 SSDO를 생성하였습니다.연구 결과에 따르면 산소가 풍부한 표면 지역에서도 용존산소 수치가 감소하고 있으며, 이러한 감소는 주로 해수면 온도(SST)의 변화에 기인하는 것으로 나타났습니다.
연구 하이라이트:
* 전 세계 해양 표면 용존산소에 대한 포괄적 모델링 프레임워크 제안
* 주요 변수와 예측된 용존산소 결과에 미치는 영향을 식별하기 위해 SHAP 인터프리터를 도입했습니다.
* 전 세계 해양의 용존산소의 높은 동적 변화를 이해하고 탈산소화의 법칙과 원인을 탐구하는 데 도움이 됩니다.

종이 위치대지:
https://pubs.acs.org/doi/10.1021/acs.est.3c08833
SSDO 데이터 세트 주소:
https://go.hyper.ai/BBlqA
공식 계정을 팔로우하고 "해수면 용존산소"에 답글을 남겨 전체 PDF를 받아보세요.
데이터 세트: 위성 + 현장 측정 데이터
본 연구에 사용된 데이터에는 위성 데이터, 고정 선박, 전도도 측정기 현장 측정 데이터가 포함됩니다.
위성 데이터 세트에는 해수면 온도(SST), 해수면 염도(SSS), 엽록소 a(Chl-a), 해수면 바람(SSW), 해수면 이상(SLA)이 포함됩니다. SST 데이터는 OISST 데이터세트에서, SSS 데이터는 유럽 우주국(ESA)의 CCI 프로젝트에서, Chl-a 데이터는 MODIS Aqua 및 Terra 위성에서, SSW 데이터는 VAM 방법과 다중 위성 마이크로파 바람 및 기기 관측 플랫폼 간 교차 교정을 결합한 방법에서, SLA 데이터는 AVISO 프로젝트에서 가져왔습니다.
고정 선박 및 전도도 측정기 현장 측정값은 2018년 세계 해양 데이터베이스(WOD)의 해양 관측소 데이터(OSD)와 고해상도 전도도-온도-수심(CTD) 하위 데이터베이스에서 얻습니다.
본 연구에서 사용된 현장 측정 데이터는 그림에 표시되어 있습니다.총 28,044개의 기록이 있으며, 그 중 2019년의 기록이 241개입니다.

(a) 현장 측정 데이터의 공간 분포
(b) 현장 측정 데이터의 시간 분포
(c) 다양한 해양 현장 측정의 데이터 분포
(d) 7대 주요 해양 수문 변수 간 상관 행렬 분석
모델 아키텍처: DOsurface-Pred 프레임워크의 세 가지 주요 구성 요소

연구자들은 시공간 정보를 내장하기 위한 해석 가능한 머신 러닝 프레임워크를 제안했습니다.프레임워크는 세 가지 주요 부분으로 구성되어 있습니다. 시공간 정보 임베딩 모듈, 백본 회귀 모듈, SHAP 설명 모듈입니다.
1부,시공간 정보 데이터의 다중 위성 및 현장 측정 사용, 즉 샘플 X나= {X나는 공간적이다,
엑스i 시간적, 엑스i 위성1, ..., Xi 위성 n}를 입력으로 사용합니다. 시공간 정보 임베딩 모듈을 통해 공간 및 월 정보를 극좌표로 변환하고, 변환된 X‘나={X‘나는 공간적이다, 엑스‘i 시간적, 엑스‘i 위성1, ..., X‘i 위성 n} 글로벌 표현.
그 다음, X‘나 두 번째 부분으로 전달됩니다.다양한 모델은 다단계 그리드 검색 교차 검증을 통해 평가되었습니다.

위 표는 백본 모델의 성능 평가표입니다.DOsurface-Pred 프레임워크의 성능은 이 프레임워크를 채택하지 않은 모델에 비해 향상되었습니다.
또한, 모든 트리 기반 머신 러닝 모델은 벤치마크인 다중 선형 회귀 모델보다 우수한 성능을 보였습니다. 이러한 모델은 성능에 따라 다음과 같이 내림차순으로 순위가 매겨졌습니다: ET, RF, GBDT, XGBoost, MLP. 안에,ET 모델은 모든 평가 지표에서 11.67 μmol/kg의 RMSE 값을 기록하며 가장 좋은 성과를 보였습니다. 이 모델은 용존산소(DO) 모델링에서 일반화 능력이 더 우수했으며 모델의 과적합 현상을 줄일 수 있었습니다.
세 번째 부분에서는,연구자들은 SHAP 해석성 방법을 사용하여 샘플 특징 값이 모델 출력 결과에 미치는 영향을 평가했습니다. 이러한 프레임워크를 통해 최적의 모델에 따른 예측 결과가 생성됩니다.
SHAP은 다양한 고유값이 예측 결과에 미치는 영향을 정량화하여 모델 출력을 더 쉽게 이해하고, 주요 변수와 용존 산소 예측 결과에 미치는 영향을 파악할 수 있습니다.
실험 결론: 해수면 온도(SST)는 해수면의 용존산소 함량에 영향을 미치는 주요 원인입니다.
DOsurface-Pred 프레임워크를 사용하면 전 세계 해수면 용존산소 농도를 정확하게 평가할 수 있습니다.연구진은 이러한 프레임워크를 기반으로 2010~2018년의 대규모 해수면 용존산소 데이터 세트를 생성하고 이를 SSDO 제품이라고 명명했습니다.

(a,b) RMSE 및 편향 오류 (c,d) 다른 연도 및 월의 총 불확실성 및 그 구성 요소(M, R, P)
연구진은 최적 모델이 생성한 결과를 평가하기 위해 불확실성 추정과 시공간적 검증을 수행했습니다.
첫째, SSDO 제품의 오차와 불확실성을 평가한다. 실험 결과는 세 가지 오류(측정 오류 M, 표현 오류 R, 예측 오류 P)가 함께 전체 불확실성을 발생시킨다는 것을 보여줍니다.총 불확실성은 ±13.02 μmol/kg으로 추산되었습니다.

(a) 예측 및 측정된 PFL 값의 산포 밀도 플롯 (b) 아래에 제공된 플롯 번호에 맞게 번호가 매겨진 일치하는 PFL 포인트의 공간 위치 (ch) PFL 측정 이상 값과 비교한 각 위치의 산소 이상의 시간적 추세
두 번째로, 연구진은 독립적인 부표 측정 데이터 세트를 사용하여 SSDO의 정확도와 시계열을 추가로 검증했습니다.결과는 예측 결과가 R² 값 0.86으로 PFL 데이터베이스와 잘 맞는다는 것을 보여줍니다.
또한 연구진은 다양한 해양 지역의 장기 부표 관측 위치에 대한 비교 평가를 실시했습니다.결과는 예측이 부표로 측정된 공간적 변동성과 장기적 추세와 일치함을 보여줍니다.이러한 평가는 예측 결과를 확실하게 검증하고 다양한 시나리오에 적용 가능성을 분석하는 데 도움이 됩니다.
연구원들은 또한 SSDO 제품에 대한 통계 분석을 수행했습니다. 결과는 SSDO 데이터가 WOD 장기 기록 데이터와 유사한 공간 분포를 가지고 있음을 보여줍니다.저산소지대가 지속적으로 확장되면서 해수면의 용존산소 수준도 포화상태에 이르렀습니다. 용존산소가 완전히 교환되는 해수면에서도 용존산소는 연평균 0.22μmol/kg씩 감소추세를 보인다.또한 해수면 용존산소의 연간 변화는 전형적인 해양 변화 현상과 상관관계를 보입니다.

(a) 모델 출력에 대한 글로벌 기능 평균의 영향 평가
(b) 모델 출력에 대한 로컬 기능의 영향 평가
(c, d) SST 및 SSS가 모델 출력에 미치는 영향 분석
(e,f) SST 및 SSS 특성의 영향에 대한 공간 분포
연구진은 SHAP 해석 방법을 사용하여 온도와 염도와 같은 해양 요인이 해수면 용존산소에 미치는 영향을 더욱 명확히 밝혔습니다. 안에,온도(SST)와 염도(SSS)가 주요 통제 요인이었으며, 용존 산소에 부정적인 영향을 미치는 것으로 나타났으며, SST가 용존 산소 수준에 가장 큰 영향을 미쳤습니다.이러한 평가는 모델링의 신뢰성을 향상시키고 해양의 용존산소의 시공간적 분포 변화와 탈산소화의 원인을 탐구하기 위한 설명 가능한 요인에 대한 정량적 결과를 제공하는 데 도움이 됩니다.
요약하자면, 연구자들은 DOsurface-Pred 프레임워크를 사용하여 SSDO 데이터 세트를 생성하고 SHAP 해석 방법을 도입했습니다.산소가 풍부한 해수면에서조차 용존산소 함량은 감소 추세를 보였으며, 이러한 감소는 주로 해수면 온도(SST) 변화에 기인하는 것으로 확인되었습니다.
AI와 바다, 심해의 알려지지 않은 신비를 탐험하다
IUCN의 글로벌 해양 및 극지 프로그램의 해양 과학 및 보존 담당 수석 고문인 Dan Laffoley는 다음과 같이 말했습니다."바다의 용존산소 농도는 지속적으로 감소하고 있으며, 이는 이미 기온 상승과 산성화에 직면해 있는 해양 생태계에 스트레스를 가중시키고 있습니다."
현재, 전 세계 및 산업 전반의 탄소 배출 감축을 가속화하는 것 외에도, 해양 저산소 현상에 대한 심층 연구와 지구 생명에 영향을 미치는 중요한 요인 분석을 통해 사람들은 다양한 생물의 멸종 또는 생존 이유를 더욱 정확하게 이해하고, 나아가 "올바른 약을 처방"할 수 있습니다.
이 과정에서 사물 인터넷, AI와 같은 새로운 기술의 역량이 점차 더욱 심층적으로 적용되었습니다. 위에서 언급한 해상표면 용존산소 분석 프레임워크 외에도 일부 학자들은 위성 원격 감지, 드론, 부표, 소나, 수중 광학 장치 등 해양 데이터를 기반으로 한 해양 쓰레기 관리, 해양 생물 다양성 보호 및 기타 측면에 대한 연구를 수행했습니다.
예를 들어, 2019년에는유엔 환경 계획은 메콩강과 갠지스강의 플라스틱 오염 문제를 해결하기 위해 CounterMEASURE라는 대책 프로젝트를 시작했습니다.이 프로젝트에서는 드론을 사용하여 메콩강 유역의 항공 사진을 촬영하고, 메콩강 유역의 플라스틱 폐기물 출처와 경로를 83.9%의 정확도로 파악하는 식별 및 모니터링 모델을 개발했습니다.
또한 호주의 The Ripper Group은또한 우리는 드론과 머신 비전 기술을 활용해 상어를 식별하는 제품도 개발했습니다.이 제품은 상어로 인해 해안 지역이 침범당하는 것을 막는 데 사용될 뿐만 아니라, 상어 생태계를 보호하는 데도 중요한 역할을 합니다.
인간 사회의 높은 탄소 배출이 이미 지구 기후와 생태환경에 심각한 영향을 끼쳤다는 것은 사실입니다. 그 중에서도 지구상 생명의 기원인 해양 생태환경의 보호 또한 시급합니다. 가까운 미래에 AI 기반 환경 보호 조치가 증상과 근본 원인을 해결하는 동시에 해수 온도 상승과 용존산소 농도 감소에 대한 진실을 밝혀내고, 근원부터 바다의 투명도를 회복할 수 있기를 기대합니다.
참고문헌:
1.https://mp.weixin.qq.com/s/bUbYptqccBXC2T9dvkfOfA
2.https://www.cdstm.cn/gallery/hycx/qyzx/201909/t20190904_923957.html
3.http://www.cbcgdf.org/NewsShow/4854/10658.html