HyperAIHyperAI

Command Palette

Search for a command to run...

유럽의 한 연구팀이 20초 만에 15일간의 해양 예측을 제공할 수 있는 고해상도 지역 해양 예측 모델인 SeaCast를 제안했습니다.

Featured Image

해양 예측 시스템은 선박 안전, 양식 관리, 연안 지역 위험 예방 및 통제, 해양 생태 모니터링과 같은 분야에서 필수적인 지원 역할을 수행합니다. 과거에는 이러한 시스템이 주로 물리 방정식에 기반한 수치 모델에 의존하여 작동했습니다.코페르니쿠스 해양환경모니터링서비스(CMEMS) 내의 지중해 예측 시스템(MedFS)을 예로 들면, 이 시스템은 양방향으로 결합된 파랑-해류 수치 모델을 사용하여 최대 10일 동안 약 4km(1/24°)의 수평 해상도로 해양 예측 정보를 제공합니다.이는 지중해 지역에서 인정받는 예측 기준이 되었습니다.

하지만 높은 정확도는 막대한 계산 비용을 수반합니다. MedFS는 89개의 CPU 코어를 필요로 하며 10일 예보를 완료하는 데 약 70분이 소요되고, 141개의 수심층을 포괄하는 해상 상태 분포도를 출력합니다. 이처럼 높은 계산 부하로 인해 신속한 시나리오 시뮬레이션이나 앙상블 예측과 같이 빠른 시일 내에 결과를 도출해야 하는 응용 분야에서는 사용이 제한적이며, 실제 작전에서 긴급 상황에 효과적으로 대응하기 어렵습니다.

최근 몇 년 동안 기계 학습 기반 날씨 예측 분야에서 상당한 진전이 이루어졌습니다. 트랜스포머, 신경 연산자, 그래프 신경망과 같은 고급 아키텍처를 활용하여 기계 학습 방법은 전 지구적 규모에서 기존 수치 예측과 비슷하거나 그 이상의 성능을 달성했습니다. 그러나 이러한 성공적인 경험을 고해상도 지역 해양 예측 시나리오에 적용하는 데에는 여러 가지 과제가 있습니다.불규칙적인 육지-해양 분포, 복잡한 측면 경계 조건, 그리고 수직 성층 변수에 대한 상세한 특성화 필요성 때문에 기존의 전지구적 규모 해양 AI 모델을 지역적 과제에 직접 적용하기는 어렵습니다.

이러한 기술적 격차를 해소하기 위해 핀란드 헬싱키 대학교, 지중해 기후변화 연구센터, 이탈리아 살렌토 대학교로 구성된 공동 연구팀이 연구를 진행했습니다.지역 해양 예측을 위해 특별히 설계된 SeaCast라는 그래프 신경망 모델이 개발되었습니다.이 모델은 기술적 아키텍처에서 몇 가지 핵심적인 혁신을 이루었습니다. 그래프의 구축, 학습 및 평가 과정을 최적화함으로써 해양 격자의 불규칙한 기하학적 구조에 정확하게 적응할 수 있으며, 해수면 부근의 주요 대기 강제력 데이터를 도입하여 예측의 물리적 상관관계를 강화하고, 측면 경계 강제력을 결합함으로써 해수의 유입 및 유출 과정을 정확하게 특성화하고 전지구 해양 순환 시스템과의 일관성을 확보하여 해양 상태를 고정밀도로 예측할 수 있습니다.

연구 하이라이트:

* 본 연구에서는 그래프 신경망 기반의 고해상도 지역 해양 예측 머신러닝 모델인 SeaCast를 제안합니다.

이 모델은 과거 재분석 및 분석 데이터를 직접 학습하여 지중해의 주요 요소들을 예측합니다. 모든 수직적 수준과 모든 시뮬레이션 요소에서 기존 MedFS 모델보다 우수한 성능을 보입니다.

* 모델 학습 후, 1/24° 격자에서 18개 수직 레벨에 걸쳐 15일 예측을 단일 GPU에서 단 20초 만에 완료할 수 있으며, 이는 CPU 클러스터에서 실행되는 물리적 기본 모델보다 훨씬 빠릅니다.

서류 주소:

https://www.nature.com/articles/s41598-025-31177-w

더 많은 논문을 보려면 여기를 클릭하십시오.https://hyper.ai/papers

데이터 세트: 해양 상태, 대기 강제력, 측면 경계 및 위성 검증 데이터

본 연구에서 구축한 데이터 세트는 해양 상태, 대기 강제력, 측면 경계 강제력 및 위성 관측 자료의 네 가지 주요 범주를 포괄합니다.SeaCast 모델의 학습, 검증 및 테스트를 위한 시스템 지원을 제공합니다.

해양 상태 데이터는 주로 지중해 해양 물리 분석 및 예측 시스템에서 제공됩니다.이 시스템은 NEMO v4.2 해양 모델과 WAVEWATCH III v6.07 파랑 모델의 양방향 결합을 기반으로 구축되었습니다. 시뮬레이션 정확도를 향상시키기 위해, 이 시스템은 현장 관측 자료와 위성 원격 탐사 데이터를 효과적으로 융합하는 3차원 변분 동화 기법인 OceanVar를 사용합니다. 연구팀은 모델링을 위해 200미터 이하의 간격으로 18개의 수심을 선정했으며, 지형 데이터는 GEBCO 전지구 지형 데이터베이스에서 이중선형 보간법을 통해 얻었습니다.

이 모델은 초기에는 35년(1987~2021년) 동안의 지중해 재분석 일평균 데이터를 사용하여 학습되었고, 2022~2023년의 운영 분석 데이터를 사용하여 미세 조정되었습니다. 이러한 미세 조정은 모델이 최근 해양 조건을 학습하고, 분석 데이터를 초기 조건으로 하는 운영 시나리오의 요구 사항에 적응하며, MedFS 운영 시스템의 업데이트를 수용할 수 있도록 하기 위한 것이었습니다. 모델 검증에는 2024년 1월부터 6월까지의 분석 데이터(177개 샘플)가 사용되었으며, 테스트 데이터는 2024년 7월 초부터 12월 말까지의 일별 초기화 예측으로 구성되었습니다. 각 초기화는 15일 예측을 생성했으며, 예측 정확도 평가는 SeaCast의 예측 리드 타임을 완전히 포함하도록 2025년 1월 14일까지 계속되었습니다.

연구팀은 2미터 높이의 기온, 해수면 기압, 그리고 풍속 성분으로부터 계산된 10미터 높이의 풍응력 성분을 대기 강제력에 포함시켰습니다.훈련 단계에서 사용된 대기 데이터는 6시간 간격의 ERA5 재분석 데이터를 기반으로 하여 일일 평균값으로 집계되었습니다. 테스트 단계에서는 ECMWF 앙상블 제어 예측(ENS)과 인공지능 예측 시스템(AIFS)의 6시간 간격 집계 일일 예측값을 사용하여 다양한 대기 강제력의 영향을 비교했습니다. 모델은 단기 추세를 포착하기 위해 3개의 연속적인 시간 단계를 갖는 슬라이딩 윈도우 방식을 대기 강제력 입력값으로 사용했습니다.

또한, 연구팀은 MedFS 또는 전지구 해양 예측 데이터를 사용하여 동적 경계 강제력을 제공함으로써 지브롤터 해협 지역(서경 5.2° 서쪽)과 다르다넬스 해협 지역(북위 39.9°~40.4°, 동경 25.9°~26.4°)을 모델의 개방형 측면 경계로 정의했습니다. 코페르니쿠스 해양 예측 자료는 일반적으로 10일의 예측 기간을 가지는 반면, 본 연구에서는 15일 예측 기준을 사용한다는 점을 고려할 때,연구팀은 혁신적인 외삽법을 사용하여 경계 영역의 마지막 예측 상태를 5회에 걸쳐 연속적으로 외삽했습니다.측면 경계 강제장의 노화 시간을 교묘하게 연장하여 전체 노화 과정 동안 경계의 일관성을 보장합니다.

위성 데이터는 주로 모델 예측 검증 및 오류 평가에 사용되며, 해수면 온도와 해수면 이상치라는 두 가지 유형의 데이터를 포함합니다.해수면 온도는 코페르니쿠스 L3S 다중 센서 융합 제품(일주기, 1/16° 해상도)을 사용하여 측정했으며, 일주기 가열 효과를 제거하기 위해 야간 관측값만 포함했습니다. 검증 과정에서 모델 예측값은 비교를 위해 L3S 격자로 재샘플링되었습니다. 해수면 이상치는 여러 고도계 위성에서 5Hz로 관측한 데이터를 통합한 코페르니쿠스 레벨 3 실시간 제품을 사용하여 측정하고 잡음을 줄이기 위해 필터링했습니다. 모델에서 출력된 해수면 높이는 이상치로 변환한 후, 검증을 위해 이중선형 보간법을 통해 위성 궤도 좌표로 변환했습니다.

SeaCast: 그래프 신경망 기반의 고해상도 지역 해양 예측 모델

SeaCast는 지중해 지역을 위해 특별히 설계된 데이터 기반 해양 예측 모델로, 1/24°(약 4km) 수평 격자에서 18개 수직층에 걸쳐 최대 15일간의 해양 예측을 제공할 수 있습니다.이 시스템의 공간 해상도는 현재 운영 중인 MedFS 시스템과 동일하며, 수직적으로 층화된 동서 방향 해류, 남북 방향 해류, 염분, 온도 및 해수면 높이를 포함하는 총 73개의 예측 영역을 예측할 수 있습니다.

이 모델의 가장 두드러진 장점은 계산 효율성입니다.SeaCast는 단일 GPU에서 단 20초 만에 15일간의 전체 예보를 완료합니다.반면, MedFS는 120초 간격으로 141개의 수직 레이어 결과를 출력하는 데 89개의 CPU 코어가 필요하며, 10일 예보를 생성하는 데 약 70분이 소요됩니다. 두 시스템은 근본적으로 다른 방식으로 작동하지만, 고해상도 상층 해양 예보에서 데이터 기반 방식의 효율성 이점은 분명합니다.

SeaCast는 지중해의 특징에 맞춰 계층적 그래프 그리드를 기반으로 하는 인코딩-처리-디코딩 아키텍처를 사용합니다. 아래 그림에서 볼 수 있듯이, 입력 해양 상태와 대기 강제력은 먼저 저해상도 다중 스케일 그리드 표현으로 인코딩됩니다. 그 후, 그래프 신경망 계층들이 이러한 잠재 특징들을 계층적으로 처리하여 모델이 해양의 단거리 및 장거리 상호작용을 효과적으로 포착할 수 있도록 합니다. 처리된 출력은 다시 원래의 고해상도 그리드로 디코딩됩니다.

SeaCast는 그래프 신경망을 사용하여 자기회귀 해양 예측을 수행합니다.

바로 다음 순간의 상태를 직접 예측하는 것과는 달리,이 모델은 해양 상태의 일일 변화 추세를 학습하는 데 중점을 둡니다. 예측된 변화를 현재 상태에 중첩하고 동적 경계 조건을 통합하여 다음 시간 단계에 대한 완전한 예측을 생성합니다.이 상태 데이터는 모델의 새로운 입력값으로 사용되어 자기회귀 루프를 통해 다양한 시점에서의 예측을 가능하게 합니다. 단일 그리드 레이어의 노드만 연결하는 GraphCast와 같은 다중 스케일 모델과 비교하여, 본 연구에서 사용된 계층적 접근 방식은 예측 영역을 여러 개의 독립적인 그리드 레이어로 분할하여 그리드와 그래프 간의 연결성을 더욱 균일하게 만들고 노드 이웃 크기의 차이로 인한 시뮬레이션 편향을 효과적으로 줄입니다.

대기 강제력장은 10미터 풍응력 성분, 2미터 기온, 해면 평균 기압, 그리고 계절 지표로서 연간 누적 일수의 사인 및 코사인 값을 포함하여 대기 조건에 대한 해양의 반응을 종합적으로 고려합니다. 학습 단계에서는 지브롤터와 다르다넬스 해협 경계 지역의 예측 조건을 실제 값과 중첩하여 사용하고, 평가 단계에서는 이를 MedFS 예측 데이터로 대체하여 개방 경계 조건을 처리하고 해수 유입 및 유출의 보다 현실적인 동적 과정을 구현합니다.

SeaCast 모델은 먼저 35년간의 일별 재분석 데이터를 사용하여 200회 사전 학습을 수행한 후, 2년간의 분석 데이터를 사용하여 30회 미세 조정을 수행했습니다. 사전 학습은 64개의 AMD MI250x GPU에서 20.5시간(1312 GPU 시간) 동안 데이터 병렬 처리 방식으로 실행되었고, 미세 조정은 8개의 GPU에서 3.5시간(28 GPU 시간) 동안 실행되었습니다.

SeaCast의 예측 능력은 MedFS 모델보다 우수합니다.

SeaCast 모델의 예측 성능을 평가하기 위해 다차원 실험을 수행했습니다. MedFS를 벤치마크로 사용하여 고온 극한 현상 식별, 대기 강제력의 영향, 학습 기간과 같은 주요 영역에서 예측 능력을 평가하기 위한 제어 실험을 설계했습니다.

SeaCast와 MedFS를 비교하는 실험에서 MedFS의 예측 선행 기간은 10일이었습니다.SeaCast는 ECMWF의 대기 제품을 15일 기간으로 확장하여 통합하고 측면 경계를 외삽함으로써 15일 해양 예측을 달성했습니다.본 실험에서는 동서 방향 해류, 남북 방향 해류, 염분, 온도, 해수면 온도, 해수면 높이 차이 등 6가지 요인을 선정하였다. 층화 검증법을 사용하였으며, 지속성 기준선을 하한값으로 설정하였다. 실험 결과는 아래 그림에 제시되어 있다.SeaCast는 전반적으로 MedFS보다 우수한 성능을 보이며, 예측 선행 시간이 길어질수록 격차가 커집니다.수직 성층화 분석 결과, 온도와 해류의 이점은 해수면 근처에서 가장 두드러지게 나타나는 반면, 염분의 최적 효과는 더 깊은 수심에서 관찰됩니다. 다만 192미터 깊이에서는 SeaCast가 MedFS보다 유의미하게 우수한 성능을 보이지 못했는데, 이는 심층부의 과정이 고려되지 않았기 때문일 수 있습니다.

SeaCast, MedFS 및 지속적 벤치마크 모델의 예측 오류 변동

극단적인 현상을 식별하기 위해 연구진은 해양 열파의 정의를 활용하고 위성 데이터를 기반으로 해수면 온도의 90번째 백분위수를 계산하여 극단적인 온도 현상의 임계값을 설정했습니다. 결과는 아래 그림에 나와 있습니다.SeaCast와 MedFS 모두 인식 능력 측면에서 지속성 벤치마크를 크게 능가했으며, SeaCast가 약간 더 우수했습니다.15일이라는 예측 기간은 조기 경보를 위한 더 많은 시간을 제공합니다.

HSS 점수는 해수면 온도 이상치(90번째 백분위수 이상)를 감지하는 데 사용됩니다.

연구진은 훈련 기간과 미세 조정의 영향을 평가하기 위해 다양한 실험 변형을 설계했습니다. 결과는 아래 그림에 나와 있습니다. 동서 방향 해류, 남북 방향 해류, 온도 및 해수면 온도의 경우, 10년치의 재분석 데이터만으로 훈련된 모델은 MedFS와 유사한 성능을 보였습니다. 그러나 염분과 해수면 이상치는 MedFS보다 우수한 성능을 보이기 위해 35년치의 데이터와 미세 조정이 필요했습니다. 미세 조정은 해수면 이상치에 대해 제한적인 개선 효과만 보였는데, 이는 검증 데이터의 부족 때문일 가능성이 있습니다. 하지만 다른 요소들에 대해서는 미세 조정된 버전이 미세 조정되지 않은 버전보다 우수한 성능을 보였습니다. 이 결과는 과거 데이터가 부족한 지역에 중요한 시사점을 제공합니다.단 10년 치의 재분석만으로도, 더 낮은 비용으로 수치 모델과 유사한 성능을 가진 기계 학습 예측 모델을 훈련시킬 수 있습니다.

다양한 예측 선행 시간에서 기준 모델 대비 SeaCast 변형 모델과 MedFS 모델 간의 정규화된 RMSE 차이

AI 기반 해양 예측: 글로벌 학계와 산업계의 탐구 및 실천

전 세계적으로 학계와 산업계는 인공지능과 해양 예측 기술의 통합 및 혁신을 촉진하기 위해 전례 없는 깊이와 폭넓은 협력을 진행하고 있습니다. 여러 대표적인 연구 결과와 운영 시스템들이 이 분야의 기술 지형을 재편하고 있습니다.

그중에서도 유럽 중기예보센터(ECMWF)는 전 세계 중기예보의 권위 있는 기관으로서, 기존의 수치예보 시스템인 IFS를 지속적으로 최적화하는 동시에...최근 AIFS 인공지능 예측 시스템이 출시되어 운영 단계에 진입했습니다.ECMWF는 이러한 데이터 기반 프레임워크를 지구 시스템 모델로 확장하고 있으며, 해양, 해빙, 해양 파도와 같은 구성 요소의 기계 학습 모델링에 중점을 두고 있다는 점에 주목할 필요가 있습니다.

한편, 엔비디아의 Earth-2 프로젝트는 기후 및 해양 시뮬레이션 분야에서 이 거대 기술 기업이 펼치는 전략적 행보를 보여줍니다. Earth-2는 단일 모델이 아니라 전 세계 날씨 예측, 기후 시뮬레이션, 생성형 AI 기반 축소 및 데이터 통합을 포괄하는 종합 기술 플랫폼입니다.핵심 구성 요소 중 하나인 FourCastNet은 Transformer 기반의 초기 글로벌 예측 모델로서, 기존의 수치 모델과 유사한 예측 능력을 달성했습니다.

또한, 구글 리서치의 NeuralGCM은 하이브리드 모델링 접근 방식의 긍정적인 사례입니다. 이 모델은 미분 가능한 대기 역학 코어와 머신 러닝을 대체하는 하위 격자 물리적 매개변수화 체계를 결합하여 수십 년간 안정적인 기후 시뮬레이션을 가능하게 합니다.

이는 인공지능이 해양 예측의 핵심적인 부분에 점차 통합되어 보조 도구의 역할을 넘어섰음을 보여줍니다. 물리 모델을 보완하는 도구로서든, 완전한 대안으로서든, 혹은 하이브리드 형태로 통합되든, 데이터 기반 접근 방식의 가치는 이론적 검증을 넘어 실질적인 탐색과 산업 응용 단계로 나아가고 있습니다. 앞으로 다모드 관측 데이터의 지속적인 축적과 생성형 인공지능의 물리적 메커니즘과의 더욱 긴밀한 통합을 통해 해양 예측 기술은 정확성, 적시성, 해석 가능성 측면에서 새로운 균형을 이루어 과학 연구 및 산업 응용을 위한 더욱 견고한 기술적 기반을 제공할 것으로 기대됩니다.

참조 링크:
1.https://mp.weixin.qq.com/s/dlEDxumoeTCkfkgY2s7V2g
2.https://mp.weixin.qq.com/s/dqhe6tWYrYvh06HTepsFpw