컴퓨팅 효율성이 3000배 증가했습니다! 라오산 연구실 등은 수치해양예측보다 성능이 우수한 대규모 지능형 해양환경예측모델 '웬하이(Wenhai)'를 제안했다.

바다에서는 다양한 시간적, 공간적 규모의 소용돌이가 활동합니다. 안에,10km에서 100km에 이르는 공간적 규모를 지닌 중규모 소용돌이는 해양 운동 에너지를 운반하는 주요 운반체입니다.이는 해류의 속도, 온도, 염도의 단기적 변화를 지배하며 대기 과정에 중요한 영향을 미칩니다. 따라서 중규모 와류를 정확하게 예측하는 것은 해양 활동과 관리에 중요할 뿐만 아니라, 날씨 예보의 정확도를 높이는 데에도 도움이 됩니다.
과거 해양학자들은 주로 대규모 물리 방정식을 수치적으로 풀어 미래의 해양 변화를 예측했습니다. 수치적 해결 과정에서 그리드 해상도가 높아질수록 계산 부담도 급격히 증가합니다.이로 인해 해양 중규모 소용돌이를 예측하는 데 엄청난 컴퓨팅 리소스가 필요하게 되었습니다.최근 몇 년 동안 인공지능(AI)은 과학 연구에 새로운 방법과 강력한 도구를 가져왔고, 날씨 예보 분야에서도 중요한 진전을 이루었습니다. 하지만,기존의 AI 대형 모델은 여전히 바다-공기 상호 작용의 표현이 부족하고 예측 결과가 모호한 등의 문제점을 안고 있습니다.이로 인해 정교한 해양 환경 예측이 어려워졌습니다.
이에 대해 라오산 연구실 우리신 원사가 이끄는 연구팀은 중국해양대학, 중국과학기술대학, 칭다오 궈시 과학기술그룹과 협력하여 물리 해양학과 인공지능을 긴밀하게 통합하고, 해양 역학 이론을 활용하여 신경망 아키텍처를 설계했습니다.우리는 전 세계 고해상도(1/12°) 해양 환경 지능형 예측 모델인 "Ask the Sea"를 개발했습니다.
관련 연구 결과는 "딥 신경망을 이용한 소용돌이 바다 예측"이라는 제목으로 Nature Communications에 온라인으로 게재되었습니다.
연구 하이라이트:
* “바다에 물어보세요” 모델은 해양 역학 이론을 사용하여 신경망 아키텍처 설계를 구동합니다.
* "Wenhai" 대형 모델의 예측 성능은 프랑스 메르카토르 국제해양센터가 발표한 수치예보체계보다 우수
* "Wenhai" 대형 모델은 수치예보 모델에 비해 계산 효율이 3,000배 향상되었습니다.

서류 주소:
https://www.nature.com/articles/s41467-025-57389-2
오픈소스 프로젝트인 "awesome-ai4s"는 200개 이상의 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
데이터 세트: 해양 관측 데이터를 실제 데이터로 사용
본 연구에 사용된 데이터는 주로 모델 학습을 위한 해양 및 대기 재분석 데이터와 모델의 예측 능력을 평가하기 위한 관측 데이터를 포함합니다. 재분석 데이터에는 프랑스의 메르카토르 국제해양센터에서 제공하는 GLORYS 글로벌 1/12° 해양 재분석 데이터와 유럽 중기 기상 예보 센터의 ERA5 글로벌 1/4° 대기 재분석 데이터가 포함됩니다.
기본적으로 재분석 데이터를 초기 예측 필드로 사용하는 기존 AI 기상 모델과 달리,본 연구에서는 대규모 모델을 구동하기 위해 해양 수치 예측 시스템과 일치하는 초기장과 강제장을 엄격하게 사용하며, 해양 관측 데이터를 실제 값으로 사용합니다.해양모델과 해양수치예측시스템의 실제 예측능력을 객관적으로 평가한다.
최초의 해양 예보는 프랑스의 메르카토르 국제해양센터의 GLO12v4 예보 시스템에서 나왔고, 대기 예보는 유럽 중기 기상 예보 센터의 IFS HRES 예보 시스템에서 나왔습니다. 관측 자료에는 Argo가 측정한 수온-염도 분포, 위성 원격 감지로 측정한 해수면 높이, 표류 부표로 측정한 해수면 온도와 연안 근처 표면 해류 속도가 포함됩니다.
모델 프레임워크: 해양 역학 이론이 신경망 아키텍처 설계를 주도합니다.
기존의 대규모 AI 모델은 해양-공기 상호작용을 충분히 표현하지 못하고 예측 결과가 모호하다는 문제점이 있어 정교한 해양 환경 예측을 실현하는 데 어려움을 겪고 있습니다. 물리 해양학과 인공지능을 긴밀하게 통합하여, 해양 역학 이론에 기반한 신경망 아키텍처를 설계하였으며, 이를 통해 기존 대형 AI 모델의 단점을 효과적으로 극복했습니다.
"Wenhai" 모델은 대량 공식을 신경망에 명시적으로 내장합니다.이는 바다와 공기 사이의 운동량, 열, 물질 교환을 정확하게 특성화합니다. 모델이 지형과 해안 경계를 인식할 수 있도록 바다와 육지 분포 마스크를 사용합니다. 해양 상태의 변화 추세를 예측 대상으로 사용하여 모델이 빠르게 변화하는 중소 규모 프로세스에 더 많은 주의를 기울이도록 합니다. 신경망 하이퍼파라미터를 최적화하여 다운샘플링 과정에서 정보 손실을 줄이고 해양의 소규모 및 중규모 프로세스의 충실도를 향상시킵니다. 반복적 예측 과정에서 누적 오류를 개선하기 위해 미세 조정 기술을 사용합니다.

실험 결과: "Wenhai" 대형 모델의 예측 능력은 수치 해양 예측 시스템보다 우수합니다.
해양의 소규모 과정은 매우 비선형적이며 예측 가능성이 낮습니다. 게다가 해양 관측 자료가 부족하고, 동화 체계에서 제공하는 초기 필드가 실제 해양 상태와 다릅니다. 그러므로,예측된 소규모 및 중규모 프로세스가 위치 및 강도 측면에서 실제 관찰과 완전히 일치해야 한다고 요구하는 것은 어렵습니다.특히, "이중 페널티" 문제가 존재하기 때문에 RMSE(제곱평균제곱근오차)와 같은 기존의 지점 간 오차 지표는 고해상도 예측 시스템의 성능을 평가하는 데 적합하지 않습니다. 이러한 지표는 고해상도 예보 시스템의 성능을 저해상도 시스템보다 나쁘게 보이게 만들 수 있습니다. 고해상도 예보 시스템이 실제 해양 상태를 더 잘 반영할 수 있더라도 말입니다.

본 연구에서는 "원하이" 대형 모형을 GLO12v4 수치예보 시스템과 공정하게 비교하기 위해 고해상도 예보 시스템에 대한 "이웃 평가" 방안을 채택했습니다.관측값을 중심으로 일정 범위 내의 예측값을 관측 위치의 앙상블 예측으로 취하고, 이에 대한 연속 순위 확률 점수(CRPS)를 평가합니다. 2024년 4월부터 11월까지의 반환 결과는 "Wenhai" 대형 모델의 향후 10일간의 기온, 염도, 해류 속도 및 해수면 높이에 대한 예측 성능이 GLO12v4 수치 예측 시스템보다 우수한 것으로 나타났습니다. 동시에,"원하이" 대형 모델은 수치 예측 모델에 비해 계산 효율성이 3,000배 향상되었습니다.컴퓨팅 시간과 에너지 소비를 크게 절감합니다.

2024년 4월부터 11월까지 프랑스 메르카토르 국제해양학 센터의 GLO12v4 수치예측 시스템(빨간색 선)과 "Ask the Sea" 대형 모델(파란색 선)의 예측 결과에 대한 연속 순위 확률 점수(CRPS, 낮을수록 좋음)입니다.
(a) 온도 프로파일
(b) 염도 프로필
(c) 해수면 온도
(d) 해수면 이상 현상
(e) 15m 구역 속도 및
(f) 15m 경도 속도. 온도-염도 프로파일은 수직 평균화된 CRPS를 보여줍니다. 음영은 부트스트랩 방법을 사용하여 얻은 50%의 신뢰 구간을 나타냅니다.