機械学習 vs. 動的モデル、Ai2の最新研究:ACE2はわずか2分で4ヶ月間の季節予報を作成可能

特色图像

農地灌漑計画から寒波による防災・減災まで、季節天気予報は防災・減災、農業生産、エネルギー計画にとって極めて重要です。長らく、これらの予報は物理方程式に基づく動態モデルに依存していました。しかし、AIの進歩により、機械学習モデルは主要な指標において従来のモデルに匹敵するようになり、場合によっては優れた精度を達成することさえあります。

機械学習モデルの主な利点は「自己回帰予測」です。1~6時間の短期的な大気の変動をシミュレートし、その結果をモデルに入力することで、高精度な複数日予報を生成できます。一部のモデルは数週間先まで正確に予報でき、大規模なアンサンブル予報は異常気象の発生確率の予測能力を高めることもできます。しかし、大きなボトルネックが存在します。数週間を超える予報は安定性が低下し、詳細が失われやすいため、季節ごとのタイムスケール要件を満たすことが困難です。さらに、モデルの物理的メカニズムの解釈は難しく、季節予報のサンプルサイズは小さい(1年に1つの独立したサンプルのみ)。物理モデルのシミュレーションデータを使用してトレーニングセットを拡張すると、継承された誤差も伴います。

この技術的な背景において、米国気象庁エクセター・ハドレーセンター、エクセター大学、アレン人工知能研究所(Ai2)からなる研究チームは、これまでに開発された機械学習気象モデルACE2を評価し、力学モデルGloSeaと比較した。結果は、ACE2が長期自己回帰予報において安定性を維持できること、そして複雑な海洋大気の相互作用なしにERA5の歴史的データから大気の進化を学習するだけで季節予報の予備的な可能性を秘めていることを示しています。この研究は、機械学習モデルは、高度な世界的な季節予報を生成でき、短期気候予測技術の開発に新たな方向性をもたらします。

関連する研究結果は、「再解析データで訓練された機械学習気象モデルによる巧みな地球規模の季節予測」というタイトルでnpj Climate and Atmospheric Scienceに掲載されました。

用紙のアドレス:

https://go.hyper.ai/YyRfT

公式アカウントをフォローし、「ACE2」と返信すると完全なPDFが手に入ります。

AIフロンティアに関するその他の論文: 

https://hyper.ai/papers

データセット: 季節予測モデル評価のための複数ソースのデータ統合

本研究では、季節予測モデルの評価を支援するために、複数のデータソースを統合します。主要なデータソースと処理方法は以下の通りです。

過去の大気基本データはERA5再解析データセットから取得されます。予測期間全体にわたって海面温度(SST)と海氷の状況の安定性を確保するため、本研究では、6時間解像度の大気生データに基づいて各グリッドセルに標準偏差10日のガウスローリング平均フィルタを適用し、季節変動特性と境界条件の安定性を組み合わせた気候背景フィールドを構築しました。

月間降水量観測データは、全球降水気候学プロジェクト (GPCP) v2.3 データセットから取得されています。その後の降水量予測結果を検証するための観測ベンチマークを提供します。

比較に使用した従来の力学モデルデータは、1993年から2015年まで毎年初期化された予測データを使用し、GloSea運用アンサンブル予報システム(GC3.2として構成)から取得しました。このシステムは、3つのバッチ(毎年10月25日、11月1日、11月9日にそれぞれ21メンバー)で初期化された63のアンサンブルメンバーで構成されています。アンサンブルの広がりは、確率的物理スキームを使用して生成されます。シミュレーションの予報期間は6か月で、解像度は大気で約0.5°、海洋で0.25°です。このモデルには、大気用に85の垂直レベル(成層圏で85 kmまで拡張)、海洋用に75の垂直レベルがあります。このモデルは、熱帯および中緯度地域での季節内予報から季節予報で優れた性能を示し、この分野の主要な力学モデルとなっています。

予測結果の比較基準を統一するために、本研究におけるすべてのERA5再解析データとGloSeaモデルデータは、双線形補間によってACE2のネイティブ1°×1°グリッドに変換され、降水量データのみが2.5°×2.5°グリッドに補間されました。主要な気候シグナルを正確に定量化するため、本研究では中核気候指標を定義し、検証した。ENSO現象は、12月~2月(DJF)海洋ニーニョ指数(ONI)を用いて±0.5 Kの閾値で判定した。エルニーニョ冬は8回、ラニーニャ冬は9回特定された。NAO指数は、南北地域(北緯20度~55度と北緯55度~90度)の平均海面気圧の差として定義される。

アンサンブル選択および予測性能評価フェーズでは、比較可能性を確保するために、特定の初期化期間からメンバーを選択しました。ACE2は10月28日から11月1日まで初期化されたメンバー(n=20)、GloSeaは11月1日に初期化されたメンバー(n=21)です。NAO値は5日間の気候学的平均に集約され、気候学的平均状態は除去されました。本研究では、アンサンブル平均誤差(RMSEₚ)と分散(σᵢₚに基づく)を計算しました。性能は、予測可能成分比(RPC)を用いて信号対雑音比の観点から評価され、ランダムリサンプリング法を用いて有意差検定が行われました。

ACE2モデルの季節予測実装:データ駆動型制約と物理的制約の組み合わせ

本研究で使用したACE2機械学習大気モデルは、「データ駆動型と物理的制約の組み合わせ」を中核設計コンセプトとしています。ERA5再解析大気場のみを用いて学習されたこのモデルは、1°グリッド解像度で6時間ごとの大気状態の進化を正確に予測し、長期自己回帰予報において優れた安定性を維持しています。この性能は、3つの主要な設計特徴によるものです。球面空間における大気の進化パターンを効果的に捉える球面フーリエニューラル演算子アーキテクチャ、多様な予報シナリオに対応するためのユーザー定義の海洋および海氷境界条件、そして質量保存則、水蒸気循環、降水量、放射フラックスなどの主要な物理プロセスに対する制約により、物理的に一貫した予報結果が保証されます。

季節規模の予測では、ACE2 は遅延アンサンブル法を使用して予測結果を生成します。1993年から2015年の期間、モデルは毎年10月25日から11月9日まで6時間ごとにアンサンブルメンバーを初期化し、年間で合計64のメンバーを生成しました。すべての初期化フィールドは、初期状態の信頼性を確保するためにERA5再解析データから取得されました。予測は初期化時点から翌年の3月中旬まで維持され、これは1~3か月の予測期間に相当します。

境界条件処理に関しては、ACE2 は連続的な海面温度 (SST) と海氷異常データを使用します。初期化時の各グリッドセルの瞬間的な異常値と、ERA5データから得られた6時間解像度の気候状態とを組み合わせることで、この異常値は予報期間全体にわたって固定されます。この戦略は、トレーニング中に使用される時間変動境界条件とは異なり、季節予報における境界変動による干渉を軽減するのに役立ちます。気候状態は、1994年から2016年までの23年間のERA5データに基づいており、標準偏差10日のガウスフィルターで平滑化されています。時刻tにおける任意のグリッドセルのSST境界は、以下の式を用いて計算されます。海氷密接度も同様に扱われ、結果は0~1の妥当な範囲に厳密に制限されます。

さらに、比較のための境界条件の一貫性を確保するため、大気上層からの下向き短波放射フラックスと全球平均CO₂濃度を、従来の力学モデルGloSeaを用いてモデル化した。ACE2のこれら2つの境界条件に対する感度については、さらなる研究が必要である。

これらの境界条件の感度を評価するため、本研究では複数の対照実験を実施しました。1988年から2022年までのデータを用いて気候状態を推定した場合、NAO相関係数は0.54でした。前年の短波放射フラックスを用いた場合、NAO相関係数は0.43でした。また、前年のCO₂データを用いた場合、NAO相関係数は0.38でした。これらの結果は、自然変動テスト(初期化を6時間遅らせた場合のNAO相関係数は0.42)と一致しており、ACE2は現在の季節予報ミッションにおいてこれらの境界条件の変動の影響を受けず、良好な予報安定性を示していることを示しています。

ACE2はわずか6時間の観測進化訓練に基づいて優れた予測能力を発揮した

複数の研究により、機械学習は短期天気予報の技術革新を促進しただけでなく、短期気候予測(季節規模)の発展に新たな道を開いたことが確認されています。

下図に示すように、23年間の評価期間(1993~2015年)において、ACE2モデルは1~3か月の期間における季節予報において、従来の力学モデルGloSeaと非常に類似した予測精度分布特性を示し、特に平均海面気圧(MSLP)予測において優れた性能を示しました。ACE2の中心的な設計目標は、安定した気候シミュレーションを実現することであり、季節予報に特化して最適化されたものではないことは注目に値します。したがって、このシナリオ間の性能の一貫性は、参考値としてより価値があります。GloSeaと同様に、ACE2のヨーロッパにおけるMSLP予測精度は比較的低く、この地域における複雑な気候変動と予測の難しさという共通の課題を反映しています。

ACE2とGloSeaの平均海面気圧スコア(1993/1994年から2015/2016年)

定量的には、ACE2の相関係数はほとんどの地域でGloSeaの相関係数をわずかに下回っています。気温予測に関しては、下図に示すように、ACE2は南米、アフリカ、オーストラリア、北米の一部を含む広範囲で効果的な予測能力を維持しています。その予測精度分布パターンはMSLP予測と非常によく一致しており、北半球の温帯におけるACE2の地域加重平均相関係数は0.41(GloSeaは0.45)、熱帯地域ではそれぞれ0.68と0.77です。

1993/1994年から2015/2016年までのACE2とGloSeaの表面温度スコア

降水量予測においては、両モデルの全体的な予測精度は比較的低い。下図に示すように、ACE2の予測精度の空間分布はGloSeaと非常によく一致しており、特に熱帯、カリブ海、東アジアにおいて顕著である。この結果は、ACE2が世界中の複数の地域における季節変動を予測する能力をさらに裏付けている。

1993/1994年から2015/2016年までのACE2とGloSeaの降水量スコア

2 種類のモデルは、NAO 予測においても顕著な補完性を示しています。 ACE2とGloSeaのNAO予測の相関係数はわずか0.34(p=0.11)でしたが、2つの結果をアンサンブル平均すると相関係数は0.65(p<0.01)に上昇し、127メンバーを用いたGloSeaの拡張アンサンブルと同等の精度となりました。下図に示すように、アンサンブル分散と平均誤差の推移も両者の間に高い整合性を示しており、ACE2アンサンブル予測の合理性をさらに裏付けています。

冬のDJF平均北大西洋振動(NAO)の予測

ACE2は主要な気候モードの捕捉にも優れており、エルニーニョ・南方振動(ENSO)のテレコネクションをシミュレートしています。下図に示すように、エルニーニョ年とラニーニャ年の気候フィールドの複合的な差異を比較すると、ACE2が示す2つの主要変数(MSLPと地表温度)のテレコネクションパターンは、ERA5再解析データおよびGloSeaシミュレーション結果と非常によく一致していることがわかります。わずか 6 時間の大気進化トレーニングでも、ACE2 は世界中の複数の地域で ENSO に関連する年々変動の信号を正確に識別できることが確認されました。

DJFはENSOの地表条件に影響を与える

しかし、ACE2の限界は2009/2010年の極冬の予測において明らかでした。アンサンブル平均はMSLPの負のNAO偏差を正確に再現せず、北極の気圧は平均をわずかに上回る程度でした。成層圏極渦のシミュレーションは気候学的平均値に近かったものの、ERA5とGloSeaは共に極渦の大幅な弱体化を示しました。SSW予測に関しては、GloSeaはENSOと東風QBOがSSW確率に及ぼす増強効果を捉えました。ACE2は39%メンバーでのみ成層圏偏東風を示しましたが、気候学的発生状況は40%と変わりませんでした。さらに、シミュレートされたSSW確率は、エルニーニョ年(45%)、ラニーニャ年(36%)、および中立年(41%)の間で統計的な差を示さず、ENSOと成層圏のテレコネクションを完全には捉えていないことを示しています。

2009/2010年の極端冬に関連する地表および成層圏の異常

機械学習モデルの大きな利点は、計算効率にも反映されています。 ACE2 は、単一の NVIDIA A100 GPU で 2 分以内に 4 か月間の季節予報を完了します。従来の動的モデルによるシミュレーションを1回実行するだけでも、スーパーコンピュータでは数時間かかります。この効率性の利点は、季節予測における技術革新の可能性をさらに広げます。

要約すると、ACE2シリーズの予測結果は、機械学習手法が短期天気予報に適しているだけでなく、短期気候予報における技術革新と運用アプリケーションへの新たな道を提供し、地球規模の気候変動の文脈における気候リスク警告に重要な技術的サポートを提供できることを十分に実証しています。

世界的な学術界と産業界の連携:AIが気象予報を変革

近年、人工知能技術の急速な発展は気象予報の分野に大きな変化をもたらし、特に季節予報や気候予報において大きな可能性を示しています。大学や研究機関は、理論革新において画期的な進歩を続けています。例えば、マサチューセッツ工科大学 (MIT) が開発した CERA 機械学習フレームワークは、地球温暖化の文脈における気候予測の新たな道を提供します。このフレームワークは、温室効果ガス高濃度シナリオのラベル付きデータに依存しません。代わりに、制御された気候データとラベルなしの温暖気候入力を組み合わせることで、未知の気候条件下でのモデルの汎化能力を効果的に向上させます。CERAは、水分輸送やエネルギー循環といった主要な気候要素の変動傾向を捉えるだけでなく、水蒸気の鉛直構造と南北分布を復元し、極端な降水確率の予測において高い精度を示します。

ビジネス界は、テクノロジーの実装と効率性の向上を促進することに重点を置いており、機械学習モデルを実際のビジネス システムに統合することに取り組んでいます。Google DeepMind が開発した GraphCast モデルは、グラフ ニューラル ネットワークに基づいて、世界の 10 日間の天気予報を分単位で生成します。その予測指標の多くは、ヨーロッパ中期予報センター(ECMWF)の従来の数値モデルを上回っており、災害緊急対応に重要な支援を提供しています。

Nvidia は、アメリカ海洋大気庁 (NOAA) やその他の機関と協力して FourCastNet を立ち上げました。フーリエニューラル演算子を利用して高解像度の地球規模のモデリングを実現することで、異常気象の予測時間が従来の方法よりも 12 ~ 24 時間早くなり、災害の予防と軽減のための対応時間が長くなります。

今後、学際的な連携の深化、高品質なマルチソース気象データセットの改善、「物理的制約+データ駆動型」ハイブリッドモデリングフレームワークの継続的な進化により、機械学習は次世代の気候予測システムの重要な中核となり、気候変動への対応、農業生産の確保、防災能力の強化に対して、より信頼性の高い科学的サポートを提供することが期待されます。

参考リンク:
1.https://mp.weixin.qq.com/s/Q5zJUwpeT88DvojgAA1afA
2.https://mp.weixin.qq.com/s/ZqlLWpoDSdFo82Qw44Sb3A