머신러닝 vs. 동적 모델, Ai2의 최신 연구: ACE2는 단 2분 만에 4개월 계절 예측을 완료할 수 있습니다.

농경지 관개 계획부터 한파 재해 예방 및 관리에 이르기까지 계절별 기상 예보는 재난 예방 및 완화, 농업 생산, 그리고 에너지 계획 수립에 매우 중요합니다. 오랫동안 이러한 예보는 물리 방정식에 기반한 동적 모델에 의존해 왔습니다. 그러나 AI의 발전으로 머신러닝 모델은 이제 주요 지표에서 기존 모델을 능가하며, 일부 시나리오에서는 탁월한 정확도를 달성하기도 합니다.
머신 러닝 모델의 핵심 장점은 "자기 회귀 예측"입니다.1~6시간 동안의 단기 대기 변화를 시뮬레이션하고 예측 결과를 모델에 입력하면 고정밀 수일 예보가 생성됩니다. 일부 모델은 몇 주 동안의 예보를 정확하게 예측할 수 있으며, 대규모 앙상블 예보는 극한 기상 현상의 발생 가능성을 예측하는 능력을 향상시킬 수도 있습니다. 그러나 심각한 병목 현상이 존재합니다. 몇 주를 초과하는 예보는 안정성이 떨어지고 세부 정보가 손실되기 쉬워 계절별 시간 척도 요건을 충족하기 어렵습니다. 또한, 모델의 물리적 메커니즘을 해석하기 어렵고 계절 예보 표본 크기가 작습니다(연간 독립 표본 하나만 제공). 물리적 모델 시뮬레이션 데이터를 사용하여 학습 세트를 확장하면 유전적 오류가 발생할 수 있습니다.
이러한 기술적 맥락에서미국 기상청 엑서터 해들리 센터, 엑서터 대학교, 앨런 인공지능 연구소(Ai2)로 구성된 연구팀은 기존에 개발된 머신러닝 기상 모델 ACE2를 평가하고 동적 모델인 GloSea와 비교했습니다.연구 결과는 ACE2가 장기 자기회귀 예측에서 안정성을 유지할 수 있으며, ERA5 과거 데이터로부터 대기 변화를 학습하는 것만으로도 복잡한 해양-대기 결합 없이 계절 예측에 대한 예비적 잠재력을 가지고 있음을 보여줍니다. 이 연구는 다음을 처음으로 확인합니다.머신 러닝 모델은 매우 숙련된 글로벌 계절 예측을 생성하여 단기 기후 예측 기술 개발에 새로운 방향을 제시합니다.
관련 연구 결과는 "재분석 데이터로 훈련된 머신 러닝 날씨 모델을 통한 능숙한 글로벌 계절 예측"이라는 제목으로 npj Climate and Atmospheric Science에 게재되었습니다.

서류 주소:
공식 계정을 팔로우하고 "ACE2"라고 답글을 달면 전체 PDF를 받을 수 있습니다.
더 많은 AI 프런티어 논문:
데이터 세트: 계절 예측 모델 평가를 위한 다중 소스 데이터 통합
본 연구는 계절 예측 모델 평가를 지원하기 위해 다중 출처 데이터를 통합합니다. 핵심 데이터 출처 및 처리 방법은 다음과 같습니다.
역사적 대기 기본 데이터는 ERA5 재분석 데이터 세트에서 가져옵니다.,예측 기간 내내 해수면 온도(SST)와 해빙 조건의 안정성을 확보하기 위해 이 연구에서는 6시간 단위의 분해능 대기 원시 데이터를 기반으로 각 그리드 셀에 표준 편차가 10일인 가우시안 롤링 평균 필터를 적용하여 계절적 변화 특성과 경계 조건 안정성을 결합한 기후 배경 필드를 구축했습니다.
월별 강수량 관측 데이터는 Global Precipitation Climatology Project(GPCP) v2.3 데이터 세트에서 가져왔습니다.후속 강수량 예측 결과를 검증하기 위한 관측 벤치마크를 제공합니다.
비교에 사용된 전통적인 역학적 모델 데이터는 GloSea 운영 앙상블 예보 시스템(GC3.2로 구성)에서 얻었으며, 1993년부터 2015년까지 매년 초기화된 사후 예측 데이터를 사용했습니다. 이 시스템은 63개의 앙상블 멤버로 구성되어 있으며, 3개의 배치(매년 10월 25일, 11월 1일, 11월 9일에 각각 21명의 멤버)로 초기화되었습니다. 앙상블 확산은 확률적 물리 체계를 사용하여 생성됩니다. 시뮬레이션은 6개월의 예보 기간을 가지며, 대기의 경우 약 0.5°, 해양의 경우 0.25°의 분해능을 갖습니다. 이 모델은 대기(성층권에서 85km까지 확장)에 대해 85개의 수직 수준과 해양에 대해 75개의 수직 수준을 갖습니다. 이 모델은 열대 및 중위도 지역의 계절 외에서 계절 예보에 탁월한 성능을 보이며, 이 분야의 선도적인 역학적 모델을 나타냅니다.
예측 결과의 비교 벤치마크를 통일하기 위해,이 연구에서 사용된 모든 ERA5 재분석 데이터와 GloSea 모델 데이터는 선형 보간을 통해 ACE2의 기본 1°×1° 격자로 변환되었으며, 강수량 데이터만 2.5°×2.5° 격자로 보간되었습니다.주요 기후 신호를 정확하게 정량화하기 위해 본 연구는 핵심 기후 지수를 정의하고 검증했습니다. ENSO 현상은 12월-2월(DJF) 해양 니뇨 지수(ONI)를 사용하여 ±0.5K의 임계값을 사용하여 측정했습니다. 8번의 엘니뇨 겨울과 9번의 라니냐 겨울이 확인되었습니다. NAO 지수는 남북 지역(북위 20°~55°, 북위 55°~90°)의 평균 해면 기압 차이로 정의됩니다.
앙상블 선정 및 예측 성능 평가 단계에서 본 연구는 비교 가능성을 보장하기 위해 특정 초기화 기간의 멤버를 선정했습니다. ACE2는 10월 28일부터 11월 1일까지 멤버를 초기화했으며(n=20), GloSea는 11월 1일에 멤버를 초기화했습니다(n=21). NAO 값은 5일 기후 평균으로 집계되었으며, 기후 평균 상태는 제거되었습니다. 본 연구는 앙상블 평균 오차(RMSEₚ)와 분산(σᵢₚ 기반)을 계산했습니다. 성능은 예측 가능 성분비(RPC)를 사용하여 신호 대 잡음비 관점에서 평가되었으며, 유의성은 무작위 재표본 추출법을 사용하여 검증되었습니다.
ACE2 모델의 계절 예측 구현: 데이터 기반 및 물리적 제약 결합
이 연구에서 사용된 ACE2 머신 러닝 대기 모델은 "데이터 기반과 물리적 제약의 결합"을 핵심 설계 개념으로 삼았습니다.ERA5 재분석 대기장만을 사용하여 학습된 이 모델은 1° 격자 해상도로 6시간마다 대기 상태 변화를 정확하게 예측하며, 장기 자기회귀 예측에서도 탁월한 안정성을 유지합니다. 이러한 성능은 세 가지 핵심 설계 특징, 즉 구형 공간에서 대기 변화 패턴을 효과적으로 포착하는 구형 푸리에 신경망 연산자 구조, 다양한 예측 시나리오를 수용할 수 있는 사용자 정의 해양 및 해빙 경계 조건, 그리고 물리적으로 일관된 예측 결과를 보장하기 위한 질량 보존, 수증기 순환, 강수율, 복사 플럭스와 같은 주요 물리적 과정에 대한 제약 조건 덕분입니다.
계절적 규모 예측에서 ACE2는 지연 앙상블 방법을 사용하여 예측 결과를 생성합니다.1993년부터 2015년까지 이 모델은 매년 10월 25일부터 11월 9일까지 6시간마다 앙상블 멤버를 초기화하여 연중 총 64개의 멤버를 생성했습니다. 모든 초기화 필드는 초기 상태의 신뢰성을 보장하기 위해 ERA5 재분석 데이터에서 추출되었습니다. 예측은 초기화 시점부터 다음 해 3월 중순까지 유지되었으며, 이는 1개월에서 3개월의 예측 기간에 해당합니다.
경계 조건 처리 측면에서 ACE2는 연속적인 해수면 온도(SST)와 해빙 이상 데이터를 사용합니다.초기화 시점의 각 그리드 셀의 순간적인 이상치와 ERA5 데이터에서 도출된 6시간 분해능 기후 상태를 결합하여, 이 이상치는 예보 기간 내내 고정됩니다. 이 전략은 훈련 중 사용되는 시변 경계 조건과 달리, 계절 예보에서 경계 변동으로 인한 간섭을 줄이는 데 도움이 됩니다. 기후 상태는 1994년부터 2016년까지 23년간의 ERA5 데이터를 기반으로 하며, 표준 편차가 10일인 가우시안 필터로 평활화했습니다. 시간 t에서 모든 그리드 셀의 해수면 온도(SST) 경계는 다음 공식을 사용하여 계산됩니다. 해빙 농도도 같은 방식으로 처리되며, 결과는 0~1의 합리적인 범위로 엄격하게 제한됩니다.
또한, 대기 상층부에서 하향 단파 복사 플럭스와 지구 평균 CO₂ 농도는 비교를 위한 일관된 경계 조건을 확보하기 위해 기존의 역학 모델인 GloSea를 사용하여 모델링되었습니다. 이 두 경계 조건에 대한 ACE2의 민감도는 추가 연구가 필요합니다.
이러한 경계 조건의 민감도를 평가하기 위해 본 연구는 여러 차례의 통제 실험을 수행했습니다. 1988년부터 2022년까지의 자료를 사용하여 기후 상태를 추론했을 때 NAO 상관계수는 0.54였습니다. 전년도의 단파 복사 플럭스를 사용했을 때 NAO 상관계수는 0.43이었고, 전년도의 CO₂ 자료를 사용했을 때 NAO 상관계수는 0.38이었습니다. 이러한 결과는 자연 변동성 검정(초기화가 6시간 지연되었을 때 NAO 상관계수가 0.42)과 일치하며, 이는 ACE2가 현재 계절 예보 임무 동안 이러한 경계 조건 변화에 민감하지 않음을 나타내며, 우수한 예보 안정성을 보여줍니다.
ACE2는 단 6시간의 관찰 진화 훈련만으로 뛰어난 예측 능력을 보여줍니다.
여러 연구에 따르면 머신 러닝은 단기 날씨 예보의 기술 혁신을 촉진했을 뿐만 아니라 단기 기후 예측(계절적 규모) 개발을 위한 새로운 길을 열었습니다.
아래 그림에서 볼 수 있듯이, 23년간의 평가 기간(1993~2015년) 동안 ACE2 모델은 1~3개월의 시간 범위를 가진 계절 예보에서 기존 동적 모델인 GloSea와 매우 유사한 기술 분포 특성을 보였으며, 특히 평균 해수면 기압(MSLP) 예보에서 뛰어난 성능을 보였습니다. ACE2의 핵심 설계 목표는 안정적인 기후 시뮬레이션을 달성하는 것이며, 계절 예보에 특별히 최적화되지 않았다는 점에 주목할 필요가 있습니다. 따라서 이러한 시나리오 간 성능 일관성은 참고 자료로 더욱 가치가 있습니다. GloSea와 마찬가지로, 유럽에 대한 ACE2의 MSLP 예보 기술은 상대적으로 낮은데, 이는 이 지역의 복잡한 기후 변동성과 예보의 어려움이라는 공통적인 어려움을 반영합니다.

정량적으로 볼 때, ACE2의 상관계수는 대부분 지역에서 GloSea보다 약간 낮습니다. 기온 예보 측면에서는 아래 그림과 같이 ACE2가 남미, 아프리카, 호주 및 북미 일부 지역을 아우르는 광범위한 지역에서 효과적인 예보 역량을 유지하고 있습니다. ACE2의 예측 능력 분포 패턴은 MSLP 예보와 매우 일치합니다. 북반구 온대 지역에 대한 ACE2의 지역 가중 평균 상관계수는 0.41(GloSea는 0.45)인 반면, 열대 지역에 대한 상관계수는 각각 0.68과 0.77입니다.

강수량 예측에서 두 모델의 전반적인 정확도는 상대적으로 낮습니다. 아래 그림에서 볼 수 있듯이, ACE2 모델의 정확도는 GloSea 모델과 매우 유사한 공간 분포를 보이며, 특히 열대 지역, 카리브해 지역, 동아시아 지역에서 두드러집니다. 이 결과는 ACE2가 전 세계 여러 지역의 계절 변동성을 예측할 수 있음을 더욱 확증합니다.

두 가지 유형의 모델은 NAO 예측에서도 상당한 상호 보완성을 보여줍니다. ACE2와 GloSea의 NAO 예측 간의 상관계수는 0.34(p=0.11)에 불과했지만, 두 결과를 앙상블 평균화한 후 상관계수는 0.65(p<0.01)로 증가하여 127명의 멤버를 사용한 GloSea의 확장 앙상블과 비슷한 정확도를 보였습니다. 아래 그림에서 볼 수 있듯이 앙상블 분산과 평균 오차의 변화 또한 두 예측 간의 높은 일관성을 보여주며, ACE2 앙상블 예측의 합리성을 더욱 확증합니다.

ACE2는 엘니뇨-남방진동(ENSO)의 원격상관(teleconnection)을 시뮬레이션하여 주요 기후 모드를 포착하는 데에도 탁월합니다. 아래 그림에서 볼 수 있듯이, 엘니뇨 해와 라니냐 해의 기후장의 복합적인 차이를 비교하면, ACE2가 두 가지 핵심 변수인 해수면 온도(MSLP)와 지표면 온도에 대해 나타낸 원격상관 패턴이 ERA5 재분석 데이터 및 GloSea 시뮬레이션 결과와 매우 일치함을 알 수 있습니다.ACE2는 단 6시간의 대기 진화 훈련만으로도 전 세계 여러 지역의 ENSO와 관련된 연간 변동성 신호를 정확하게 식별할 수 있다는 것이 확인되었습니다.

그러나 ACE2의 한계는 2009/2010년 극한의 겨울 예보에서 여실히 드러났습니다. 앙상블 평균은 MSLP의 음의 북반구 대기압(NAO) 이상치를 정확하게 재현하지 못하여 북극 기압이 평균보다 약간 높은 수준만 모의했습니다. 성층권 극소용돌이의 모의는 기후학적 평균에 근접했지만, ERA5와 GloSea 모두 극소용돌이가 상당히 약화되는 모습을 보였습니다. 남남서(SSW) 예보와 관련하여, GloSea는 ENSO와 동풍 QBO가 남남서 확률에 미치는 강화 효과를 포착했습니다. ACE2는 39% 지역에서만 성층권 동풍을 나타냈으며, 40% 지역과 기후학적 발생 빈도에 차이가 없었습니다. 더욱이 시뮬레이션된 남남서 확률은 엘니뇨 해(45%), 라니냐 해(36%), 중립 해(41%) 사이에 통계적 차이가 없음을 보여주었으며, 이는 ENSO와 성층권 사이의 원격상관을 완전히 포착하지 못했음을 나타냅니다.

머신 러닝 모델의 중요한 장점은 계산 효율성에도 반영됩니다. ACE2는 단일 NVIDIA A100 GPU에서 2분 이내에 4개월간의 계절 예측을 완료합니다.기존 동적 모델의 단일 시뮬레이션은 슈퍼컴퓨터에서 실행하는 데 몇 시간이 걸립니다. 이러한 효율성 이점은 계절 예측에 있어 더 많은 기술 혁신 가능성을 열어줍니다.
요약하자면, ACE2 시리즈의 예측 결과는 머신 러닝 방법이 단기 날씨 예보에만 적합한 것이 아니라 단기 기후 예보에서 기술적 혁신과 운영적 응용을 위한 새로운 경로를 제공할 수 있으며, 글로벌 기후 변화의 맥락에서 기후 위험 경고에 대한 중요한 기술적 지원을 제공할 수 있음을 충분히 보여줍니다.
글로벌 학계 및 산업 협력: AI가 날씨 예보를 혁신하다
최근 몇 년 동안 인공지능 기술의 급속한 발전은 기상 예보 분야를 근본적으로 변화시키고 있으며, 특히 계절 및 기후 예측 분야에서 상당한 잠재력을 보여주고 있습니다. 대학과 연구 기관들은 이론 혁신 분야에서 끊임없이 획기적인 발전을 이루고 있습니다. 예를 들어,매사추세츠 공과대학교(MIT)에서 개발한 CERA 머신 러닝 프레임워크는 지구 온난화의 맥락에서 기후 예측을 위한 새로운 경로를 제공합니다.이 프레임워크는 고온실가스 시나리오의 라벨링된 데이터에 의존하지 않습니다. 대신, 통제된 기후 데이터와 라벨링되지 않은 온난 기후 입력 데이터를 결합하여 알려지지 않은 기후 조건에서 모델의 일반화 성능을 효과적으로 향상시킵니다. CERA는 수분 이동 및 에너지 순환과 같은 주요 기후 요소의 변화 추세를 포착할 뿐만 아니라, 수증기의 수직 구조와 남북 분포를 복원하여 극한 강수 확률 예측에 높은 정확도를 보여줍니다.
기업 커뮤니티는 기술 구현과 효율성 개선을 촉진하는 데 더욱 집중하고 있으며, 머신 러닝 모델을 실제 비즈니스 시스템에 통합하는 데 전념하고 있습니다.Google DeepMind가 개발한 GraphCast 모델은 그래프 신경망을 기반으로 전 세계의 10일 날씨 예보를 분 단위로 생성합니다.많은 예보 지표가 유럽 중기 기상 예보 센터(ECMWF)의 기존 수치 모델을 능가하여 재난 비상 대응에 중요한 지원을 제공하고 있습니다.
엔비디아는 미국 해양대기청(NOAA) 및 기타 기관과 협력하여 FourCastNet을 출시했습니다.푸리에 신경망 연산자를 사용하여 고해상도의 글로벌 모델링을 구현함으로써 극한 기상 예측 시간을 기존 방식보다 12~24시간 앞당길 수 있어 재해 예방 및 완화를 위한 대응 시간을 늘릴 수 있습니다.
앞으로 학제 간 협업이 심화되고, 고품질의 다중 소스 기상 데이터 세트가 개선되고, "물리적 제약 + 데이터 기반" 하이브리드 모델링 프레임워크가 지속적으로 발전함에 따라 머신 러닝이 차세대 기후 예측 시스템의 핵심이 되어 기후 변화에 대응하고, 농업 생산을 보장하고, 재해 예방 역량을 강화하는 데 필요한 보다 신뢰할 수 있는 과학적 지원을 제공할 것으로 예상됩니다.
참조 링크:
1.https://mp.weixin.qq.com/s/Q5zJUwpeT88DvojgAA1afA
2.https://mp.weixin.qq.com/s/ZqlLWpoDSdFo82Qw44Sb3A