Command Palette

Search for a command to run...

최대 20배 더 효율적입니다! 캘리포니아 대학교는 자기회귀 기상 예측 모델의 오류 누적 문제를 해결하기 위해 OmniCast를 개발했습니다.

Featured Image

계절 간 변동(S2S) 기상 예보는 단기 기상 예보와 장기 기후 예측 사이에 위치하며, 향후 2주에서 6주 동안의 기상 변화에 초점을 맞춥니다. S2S는 중장기 기상 예보의 공백을 정확하게 메워 농업 계획 및 재난 예방에 중요한 정보를 제공합니다. 그러나 S2S 기상 예보는 빠르게 감소하는 초기 대기 정보(단기 및 중기 예보 조건)에 의존하는 데 어려움을 겪고, 아직 완전히 드러나지 않은 느리게 변화하는 경계 신호(기후 예측 조건)를 포착하지 못합니다. 대기 시스템이 혼돈스럽고 육지와 바다가 복잡하게 상호작용하는 환경에서는 예측의 어려움이 더욱 커집니다.

최근 몇 년 동안, 기존 수치 기상 예측(NWP) 시스템에서 딥러닝 기반 기상 예측 기법으로의 기술적 발전은 S2S 기상 예측 개발에 중요한 역할을 해왔습니다. 그러나 S2S의 실제 적용에는 많은 어려움이 남아 있습니다. 예를 들어, 기존의 수치 예측 기법은 주로 복잡한 물리 방정식을 푸는 데 의존하는데, 이는 계산 비용이 많이 들 뿐만 아니라 시간도 많이 소요됩니다.데이터 기반 방법은 단기 예측에서 속도, 정확성, 정밀도를 달성하는 반면, 자기회귀 설계 기반 접근 방식은 이전 예측 결과를 기반으로 다음 단계를 계산합니다.장기적인 S2S 응용 프로그램에서는 오류가 눈덩이처럼 쌓이는 반면, S2S 날씨 예보에서 중요한 느리게 변화하는 경계 강제 신호는 무시됩니다.

이 문제를 해결하기 위해 UCLA 연구팀은 아르곤 국립연구소와 협력하여 고정밀 확률론적 S2S 기상 예측을 위한 새로운 잠재 확산 모델인 옴니캐스트(OmniCast)를 제안했습니다. 이 모델은 변분 자동 인코더(VAE)와 트랜스포머 모델을 결합하여 시간과 공간에 걸친 공동 샘플링 방식을 사용합니다.이 방법은 자기회귀 방법의 오차 누적 문제를 크게 완화하는 동시에 초기 조건을 넘어서는 기상 역학을 학습할 수 있습니다.실험 결과, 이 모델은 정확도, 물리적 일관성, 확률적 지표 측면에서 현재 방법 중 가장 우수한 성능을 달성하는 것으로 나타났습니다.

"OmniCast: 시간 규모에 따른 날씨 예보를 위한 마스크된 잠재 확산 모델"이라는 제목의 관련 연구는 최고의 AI 학술 대회인 NeurIPS 2025에 선정되었습니다.

연구 하이라이트:

OmniCast는 미래 날씨를 생성하기 위해 시공간적 차원을 동시에 고려함으로써 자기회귀 설계에 기반한 모델에서 오류가 누적되는 문제를 해결합니다.

OmniCast는 단기 날씨 예보에 필요한 초기 대기 정보와 기후 예측에 필요한 느리게 변화하는 경계 강제 조건을 동시에 고려할 수 있습니다.

* OmniCast는 정확도, 물리적 일관성, 확률적 예측 측면에서 기존 방식을 능가하며, 계산 속도는 현재 주류 방식보다 10~20배 빠릅니다.

서류 주소:

https://go.hyper.ai/YANIu

더 많은 AI 프런티어 논문:
https://hyper.ai/papers

데이터 세트: 널리 사용되는 ERA5 데이터 세트를 기반으로 다양한 예측 작업에 맞게 조정되었습니다.

OmniCast가 교육 및 평가 과정에서 적절하고 합리적인 지원을 받을 수 있도록, 본 연구는 기상 분야에서 널리 사용되는 ERA5 고해상도 재분석 데이터셋을 기본 데이터 소스로 채택했습니다. 중기 기상 예보와 S2S 기상 예보라는 두 가지 예보 작업에 대해 데이터 전처리를 수행하여 다양한 작업 요건에 맞춰 조정된 벤치마크 세트로 활용했습니다.

구체적으로,이 연구에서는 먼저 ERA5 재분석 데이터 세트에서 69개의 기상 변수를 추출했습니다.여기에는 핵심 지표의 두 가지 주요 범주가 포함됩니다.

지상 변수(4가지 범주):2m 기온(T2m), 10m U-풍속 성분(U10), 10m V-풍속 성분(V10), 평균 해수면 기압(MSLP)

대기 변수(5가지 범주):지오포텐셜 높이(Z), 기온(T), U-풍속 성분, V-풍속 성분, 그리고 비습도(Q). 대기 변수는 13개의 기압층(단위: hPa)을 포함하며, 이는 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 850, 925, 1000입니다.

이후, 연구에서는 다양한 예측 작업에 대해 시간 범위를 기준으로 데이터를 훈련, 검증 및 테스트 세트로 나누었습니다.

중기 날씨 예보 작업:벤치마크 테스트 세트로 WeatherBench2(WB2)가 사용되었습니다.훈련 세트는 1979년부터 2018년까지, 검증 세트는 2019년까지, 테스트 세트는 2020년까지의 데이터를 사용합니다. 초기 조건은 00:00(UTC)와 12:00(UTC)의 데이터를 사용합니다. 해상도는 기본 0.25°(721 x 1440 그리드)입니다.

S2S 기상 예보 과제: 벤치마크 세트로 ChaosBench를 사용합니다. 훈련 세트는 1979년부터 2020년까지, 검증 세트는 2021년부터, 테스트 세트는 2022년부터의 기간을 다룹니다. 초기 조건은 00:00(UTC)의 데이터를 사용합니다. 해상도는 1.40625°(128 x 256 그리드)입니다.

OmniCast 모델: S2S 기상 예보의 새로운 패러다임을 위한 2단계 설계

OmniCast의 핵심 기능은 기존 자기회귀 모델의 오류 누적 문제를 피하는 능력에 있으며, 이를 통해 단기 날씨 예보와 장기 기후 예보의 요구 사항을 모두 고려하는 기능을 구축하여 S2S 날씨 예보의 실제 적용을 위한 사용 가능하고 신뢰할 수 있는 도구를 제공합니다. SeasonCast 모델의 핵심 아키텍처는 "2단계" 디자인을 기반으로 합니다.먼저, VAE를 사용하여 데이터 차원 축소를 달성한 다음, 확산 헤드가 있는 Transformer를 사용하여 시계열을 생성합니다.

첫 번째 단계의 핵심 모듈은 UNet 아키텍처를 사용하여 구현된 VAE입니다.핵심 기능은 "차원 축소" 및 "재구성"으로, 고차원 원시 기상 데이터를 저차원의 연속적인 잠재 토큰(잠재 특징 벡터)으로 압축하여 큰 변수와 높은 공간 해상도로 인해 발생하는 계산 효율 문제를 줄입니다. VAE는 69개의 입출력 채널을 가지며, 이는 69개의 기상 변수에 해당합니다. 예를 들어, S2S 기상 예보 작업에서 VAE 인코더는 69 x 128 x 256 크기의 원시 기상 데이터를 1024 x 8 x 16 크기의 잠재 매핑으로 압축하여 16의 공간 차원 압축률을 달성할 수 있습니다. 생성 과정에서 VAE는 변압기에서 출력된 잠재 토큰을 원래 차원의 기상 데이터(예: 온도 및 기압)로 복원합니다.

이 연구에서는 이산형 VAE가 아닌 연속형 VAE를 사용했다는 점에 주목할 필요가 있습니다. 이산형 VAE는 지나치게 높은 압축률과 기상 데이터 변수의 수가 많아 심각한 정보 손실 등의 문제가 발생하여 2단계 생성 모델링 성능에 부정적인 영향을 미칠 수 있기 때문입니다. 반면, 연속형 VAE는 압축률이 100배에 불과하여 수백 개의 물리적 변수를 포함하는 기상 조건에 대한 더욱 중요한 기상 정보를 보존할 수 있습니다.

두 번째 단계의 핵심 모듈은 마스크 생성 변압기입니다(아래 그림 참조).마스크 오토인코더(MAE) 인코더-디코더 아키텍처가 채택되었습니다. 이는 마스크 학습 및 확산 예측을 통해 미래의 전체 시퀀스 잠재 토큰을 직접 모델링하여 "오류 없는 누적 생성"을 달성하는 데 핵심적입니다. 구조적으로는 양방향 인코더-디코더 아키텍처가 사용되어 초기 조건과 이미 생성된 가시적 토큰을 사용하여 마스크 부분의 동시 예측을 지원합니다. 트랜스포머 아키텍처는 16개 계층으로 구성된 네트워크로, 각 계층은 16개의 어텐션 헤드, 1024개의 은닉층 차원, 그리고 0.1의 드롭아웃 비율을 갖습니다.

변압기 백본망 작동 다이어그램

또한, 잠재 토큰은 연속 벡터이기 때문에 기존 분류 헤드로는 그 분포를 모델링할 수 없습니다. 따라서 확산 모델 헤드(소규모 MLP 구현)를 변압기 출력 뒤에 연결하여 마스크 내 잠재 토큰의 분포를 예측합니다(아래 그림 참조).

잡음 제거 네트워크 eθ는 zi와 xsi를 기반으로 잡음 ϵ을 예측합니다.

단기 예측의 정확도를 높이기 위해 본 연구에서는 보조 평균제곱오차 손실(mean-squared error loss)도 도입했습니다. 구체적으로,단기 날씨 예보에서는기상 시스템의 혼돈적 특성이 10일 후 크게 증가하므로, 결정론적 예측의 중요성은 점차 감소할 것입니다. MLP 결정론적 헤더를 추가하면 처음 10개 프레임의 잠재 토큰에 대한 MSE 손실을 계산할 수 있습니다. 또한, 지수적으로 감소하는 가중치 전략을 채택하면 초기 프레임의 정확한 예측의 중요성을 강조할 수 있습니다.

결과: 다른 두 가지 방법과 비교했을 때, 효율성은 기준 모델보다 10~20배 더 높습니다.

OmniCast의 효과와 발전을 검증하기 위해,연구자들은 이를 두 가지 주요 방법과 비교했습니다.하나는 최첨단 딥러닝 방법이고, 다른 하나는 전통적인 물리 모델에 기반한 수치적 방법입니다. 앞서 언급했듯이 실험 검증에는 중거리 기상 예보와 S2S 기상 예보라는 두 가지 과제가 포함되었습니다. 분석 지표에는 정확도, 물리적 일관성, 그리고 확률적 성능이 포함되었습니다.

첫째, S2S 기상예보 업무에서는연구자들은 OmniCast를 PanguWeather(PW)와 GraphCast(GC)라는 두 가지 딥 러닝 방법과 비교했으며, UKMO-ENS(영국), NCEP-ENS(미국), CMA-ENS(중국), ECMWF-ENS(유럽)의 4개 국가와 지역의 수치 모델 앙상블 시스템과도 비교했습니다.

정확도 지표(평균 제곱근 오차(RMSE), 절대 편향(ABS BIAS), 다중 스케일 구조적 유사성 단계(SSIM)) 측면에서 OmniCast는 단기 예측 리드타임 내에서 RMSE와 SSIM 모두에서 다른 벤치마크 모델보다 예상대로 낮은 성능을 보였습니다. 이는 물론 OmniCast의 학습 목표 때문이지만, 예측 리드타임이 길어짐에 따라 상대적 성능은 점차 향상될 것입니다.10일 후에는 ECMWF-ENS와 비슷한 최적의 성능을 달성합니다.다음 그림과 같이:

세 가지 핵심 변수에 따른 1~44일 예측 리드 타임 내의 다양한 방법에 대한 예측 결정론적 성능: 실선은 딥 러닝 방법을 나타내고, 점선은 수치적 방법을 나타냅니다.

주목할 점은 다음과 같습니다.OmniCast는 모든 벤치마크 모델 중에서 가장 작은 편차를 보입니다.세 가지 유형의 목표 변수에 대한 예측은 모두 편향이 거의 0에 가깝게 유지되었습니다.

물리적 일관성 측면에서,OmniCast의 물리적 일관성은 다른 딥러닝 방법보다 훨씬 뛰어납니다.더욱이 대부분의 경우, OmniCast의 성능은 모든 벤치마크 모델을 능가합니다. 이 결과는 OmniCast가 다양한 주파수 범위에서 신호를 효과적으로 보존하여 예보의 물리적 타당성을 보장할 수 있음을 보여줍니다. (아래 그림 참조)

1~44일의 예측 리드타임 내에서 다양한 방법에 대한 물리적 일관성 지수는 세 가지 핵심 변수에 따라 결정됩니다. 실선은 딥 러닝 방법을 나타내고, 점선은 수치적 방법을 나타냅니다.

확률 지표(CRPS(Continuous Ranking Probability Score) 및 SSR(Discrete Skill Ratio) - 후자가 1에 가까울수록 더 좋음)에 관해서는 정확도 지표와 유사하게 더 짧은 예측 리드 타임 내에서OmniCast의 성능은 ECMWF-ENS보다 약간 떨어지지만, 15일 후에는 ECMWF-ENS를 능가할 것입니다.요약하자면, OmniCast와 ECMWF-ENS는 다양한 변수와 예측 리드타임에서 가장 우수한 성과를 보이는 두 가지 방법입니다. (아래 그림 참조)

1~44일 예측 리드타임 내의 다양한 방법에 대한 확률 지표는 세 가지 핵심 변수로 구성됩니다. 실선은 딥러닝 방법을 나타내고, 점선은 수치적 방법을 나타냅니다.

연구팀은 위 실험 외에도 OmniCast를 올해 장기 기상 예보를 위해 제안된 딥러닝 기법인 ClimaX(Transformer 아키텍처 기반) 및 Stormer(개선된 그래프 신경망 기반)와 비교했습니다. 그 결과, OmniCast는 모든 지표에서 두 기법 모두보다 우수한 성능을 보였습니다. RMSE 지표에서 T850과 Z500은 ClimaX보다 각각 16.81 TP3T와 16.01 TP3T 낮았고, Stormer보다 각각 11.61 TP3T와 10.21 TP3T 낮았습니다. CRPS 지표에서도 ClimaX보다 각각 20.21 TP3T와 17.11 TP3T 낮았고, Stormer보다 각각 13.91 TP3T와 11.01 TP3T 낮았습니다. 이러한 결과는 OmniCast의 우수성을 보여줍니다.  장기적인 날씨 예측에 상당한 이점이 있습니다.잠재 확산 모델과 마스크 생성 프레임워크를 결합함으로써, 날씨 시퀀스의 장거리 종속성을 모델링하는 능력이 기존 딥러닝 아키텍처보다 뛰어납니다. (아래 그림 참조)

OmniCast와 다른 딥러닝 방법의 정확도 비교

그 다음 중기 기상예보 임무에서는연구팀은 OmniCast를 두 가지 벤치마크 모델과 비교했습니다. 하나는 확률론적 예측을 위한 주류 딥러닝 기법인 Gencast이고, 다른 하나는 수치 앙상블 예측 시스템의 "골드 스탠다드"인 IFS-ENS입니다. IFS-ENS는 RMSE, CRPS, SSR을 평가 지표로 사용합니다. 아래 그림을 참조하세요.

중기 예측에서 다양한 방법의 확률적 성능: 실선은 딥러닝 방법을 나타내고, 점선은 수치적 방법을 나타냅니다.

결과는 OmniCast가 모든 변수와 지표에서 IFS-ENS와 비슷한 성능을 보였고, Gencast보다는 약간 낮은 성능을 보였습니다. 그러나 추가 효율성 실험 결과, OmniCast는 고차원 원시 기상 데이터 대신 저차원 잠재 토큰을 계산에 사용하는 잠재 공간 모델링 설계의 이점을 활용했음을 보여주었습니다.  모든 벤치마크 모델보다 10~20배 더 빠릅니다.

또한, 아래 이미지에서 보여지는 것처럼,OmniCast는 32개의 NVIDIA A100 GPU에서 4일간의 학습만 필요합니다.반면, Gencast는 A100보다 강력한 32개의 TPUv5e 디바이스에서 5일간의 학습이 필요한 반면, NeuralGCM은 128개의 TPUv5e 디바이스에서 10일이 필요합니다. 또한, Gencast는 2단계 학습 과정을 필요로 하는 반면, SeasonCast는 1단계 학습만 필요합니다. 추론 과정에서도 OmniCast는 이러한 방법들보다 빠릅니다. 0.25° 해상도에서 Cencast는 480초가 걸리는 반면, OmniCast는 동일한 예측을 완료하는 데 29초밖에 걸리지 않습니다. 1.0° 해상도에서 OmniCast의 추론 시간은 11초에 불과하지만, Gencast는 동일한 하드웨어에서 224초가 걸립니다.

다양한 방법을 사용하여 15일 예측을 생성할 때 실행 시간과 해상도 비교

S2S 예보의 한계를 끊임없이 돌파하고 중장기 날씨 예보의 빈틈을 정확하게 메웁니다.

단기 기상 예보와 장기 기후 예측을 완벽하게 연결하는 S2S 기상 예보는 오랫동안 기상학 분야의 핵심 연구 분야로 자리매김해 왔습니다. 오늘날 S2S 기상 예보는 학문적 이론적 논의, 실험적 기술 혁신, 그리고 실제 적용 시나리오 측면에서 다양한 주제와 차원을 아우르는 효율적인 소통 네트워크를 구축해 왔습니다.

예를 들어, 올해 5월 말, 세계기상기구(WMO)가 주최하고 산둥대학교가 주관한 "AI + 재난 예측 및 조기 경보 국제 심포지엄"에는 30여 개국에서 온·오프라인으로 300명 이상의 전문가와 학자들이 참여했습니다. 이 컨퍼런스는 새로운 인공지능 기술과 S2S(Season-to-Sea) 예측 애플리케이션의 통합에 중점을 두었으며, 재난 예방 및 완화에 있어 S2S 예측의 역할에 대한 긍정적인 전망을 제시했습니다.

학술 세미나 외에도 실험 결과 또한 풍성했습니다. 푸단대학교 인공지능 혁신산업연구소와 상하이 지능과학원 리하오 연구원과 치위안 교수 팀은 중국 기상청 기후연구 개방실험실 루보 연구원 팀과 협력했습니다."FuXi-S2S"라는 예측 모델은 머신 러닝을 기반으로 개발되었습니다.이 솔루션은 7초 이내에 42일간의 포괄적인 예보를 완료하여 대규모 앙상블 예보를 신속하고 효과적으로 생성할 수 있습니다.
논문 제목:기존의 글로벌 계절 외 예측 모델보다 성능이 뛰어난 머신 러닝 모델
서류 주소:https://www.nature.com/articles/s41467-024-50714-1

베를린 공과대학교, 레딩대학교 등의 연구팀은 S2S 기상 예보 연구에 "원격연결" 현상을 도입했습니다. 여기에는 북극의 성층권 극소용돌이(SPV)와 열대의 매든-줄리안 진동(MJO)이 포함됩니다.검증은 점점 더 복잡해지는 세 가지 딥 러닝 모델을 설계하여 수행되었습니다.먼저, 기본적인 LSTM(Long Short-Term Memory) 모델을 개발했습니다. 그 후, SPV와 MJO 원격상관 지수를 통합하여 Index-LSTM 모델을 구축했습니다. 마지막으로, 사전 계산된 지수에서 벗어나 북극 상층 바람장과 열대 장파 복사 데이터를 시각적 분석을 통해 직접 처리하여 Vit LSTM 모델을 구축하는 등 추가적인 개선 작업을 수행했습니다. 연구팀은 세 가지 모델을 비교 분석하여 원격상관 정보가 S2S 예보 정확도 향상에 중요하다는 것을 확인했습니다. 특히, 4주차 이후, Vit-LSTM 모델은 스칸디나비아 블로킹과 대서양 해령 기상 패턴을 예측하는 데 있어 ECMWF 모델을 능가했습니다.

논문 제목:딥 러닝과 원격 연결의 만남: 유럽 겨울 날씨에 대한 S2S 예측 개선
서류 주소:https://arxiv.org/abs/2504.07625

결론적으로, S2S 기상 예보를 괴롭히는 문제는 기술의 발전과 함께 감소하고 있습니다. 앞으로 인공지능과 딥러닝 기술이 기상 분야에 더욱 통합됨에 따라 "예측 불가능한 날씨"에 대한 전통적인 이해는 필연적으로 완전히 무너질 것입니다. 구름을 관측하여 날씨를 예측하는 고대의 지혜부터 오늘날의 AI 모델이 단 몇 초 만에 한 달 이상의 예보를 생성하는 것까지, 인류의 날씨 이해와 통제는 전례 없는 수준의 명확성을 향해 나아가고 있습니다.