HyperAI超神経

ネイチャー、ケンブリッジ大学などが、予測速度を数十倍向上させる初のエンドツーエンドのデータ駆動型天気予報システムをリリースした。

特色图像

毎日夜明けになると、世界中の何百ものスーパーコンピューターが大気を何百万もの仮想立方体に分割し、熱力学、流体力学、放射伝達を含む一連の偏微分方程式を解くことで、今後 10 日間の地球の大気の動きの軌跡を推測します。数値天気予報と呼ばれるこの技術は、20世紀半ばにイギリスの気象学者リチャードソンが「天気予報工場」というアイデアを提唱して以来、現代の天気予報の基礎へと発展してきました。台風の進路予測から飛行ルートの計画、農作物の播種決定から新エネルギー発電のスケジュールまで、数値予報システムによって6時間ごとに更新される地球の大気の3次元スナップショットは、経度と緯度0.01度(約1km)の空間解像度で、人間と天気とのコミュニケーション方法を変えています。

しかし、社会の要求が高まるにつれて、物理方程式に基づく従来の数値予測モデルは、計算の複雑さが指数関数的に増大し、予測精度の向上による限界利益が減少するという二重のジレンマに直面しています。この文脈では、人工知能技術の介入は、大気科学に新たな感覚器官をインストールするようなものです。ディープ ニューラル ネットワークが衛星雲画像の微妙なテクスチャを分析し始め、強化学習アルゴリズムがパラメータ化スキームを自律的に最適化し、生成的敵対ネットワークが仮想シーンで極端な天候をリハーサルすると、天気予報の技術革命が徐々に形になり始めます。

最近、ケンブリッジ大学は、チューリング研究所、トロント大学、マイクロソフト サイエンス インテリジェンス センター、ヨーロッパ中期予報センター、英国南極調査局、Google DeepMind と協力し、エンドツーエンドのデータ駆動型気象予報システム「Aardvark Weather」を共同で立ち上げました。観測データを統合することで、全球グリッド予測とローカルサイト予測を同時に生成できます。複数の主要変数と異なるリードタイムのテストにおいて、その世界予報性能は、従来の運用数値天気予報 (NWP) ベンチマークを上回りました。ローカルサイトの予報では、このシステムは最大 10 日間のリードタイムで高い予報能力を示し、そのパフォーマンスは、人間の予報官からの入力を取り入れた後処理および高度なエンドツーエンドの予報システムを通じて最適化されたグローバル NWP ベンチマークの性能に匹敵します。さらにエンドツーエンドの調整を行うと、ローカル予測の精度が大幅に向上します。

関連する研究結果は「エンドツーエンドのデータ駆動型天気予報」と題され、ネイチャー誌に未編集版で掲載されている。

用紙のアドレス:

https://www.nature.com/articles/s41586-025-08897-0

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめており、大規模なデータ セットとツールも提供しています。

https://github.com/hyperai/awesome-ai4s

データセット: クロスプラットフォーム、マルチソース統合、革新的なデータ融合戦略の構築

Aardvark Weather システムが従来の数値気象予報 (NWP) モデルから完全に独立していることを保証するために、研究者はクロスプラットフォームでマルチソースの融合観測データセットを慎重に構築しました。システムでは、処理レベル 1B または 1C の衛星データのみを使用します。レベル 1B データは較正され、地理位置が特定されたデータを指し、レベル 1C データは、観測精度がビジネス展開要件を満たすように放射線補正と幾何学的処理がさらに完了しています。すべてのデータは 2007 年から 2020 年までの期間をカバーし、リアルタイム取得をサポートしているため、システムに安定したデータ フローを提供します。

陸地観測データは、英国気象庁の HadISD データセットから取得されます。8,719 観測所の地表温度、8,016 観測所の気圧、8,721 観測所の風速、8,617 観測所の露点温度が 6 時間ごとに更新されます。海洋観測は、世界中の船舶やブイからのリアルタイム観測を統合する米国 NOAA の ICOADS データセットに依存しています。高層大気の観測データは NCEI の IGRA アーカイブから取得され、1,375 の観測所の温度、湿度、風のプロファイルをカバーしています。研究チームは、200、500、700、850 hPa など、地表および主要な気圧レベルの観測記録を特別に選択しました。

さらに、現地観測の地理的制限により、研究者は複数ソースのリモートセンシング データを導入する必要に迫られています。本研究では、欧州のEUMETSATが提供するMetOpシリーズの衛星のASCAT散乱計データを使用し、NCEIが提供するATOVSシステム(AMSUA、AMSUB、MHS、HIRS/4機器を含む)と共同でマイクロ波赤外線協調観測ネットワークを構築しました。研究チームはさらに、NCEI の IASI ハイパースペクトル赤外線検出データを使用して、温度と湿度の垂直分布に関する詳細な情報を補足しました。研究チームは、静止衛星観測のために、赤外線と水蒸気チャネルのデータを標準化することで軌道衛星の時間的および空間的な異質性を排除する NCDC の GridSat グリッド製品を選択しました。

注目すべきは、Aardvark システムは NWP モデルとは完全に独立して動作しますが、そのモジュール アーキテクチャにより、トレーニング フェーズ中に ERA5 再解析データセットが巧みに利用されることです。 ERA5 は、ヨーロッパ中期予報センター (ECMWF) の第 5 世代再解析であり、1940 年から現在までの温度、湿度、風の場などの完全な時空間パラメータの系列を提供する最先端の全球大気再解析データセットです。この革新的なデータ融合戦略により、Aardvark Weather は従来の数値モデルの限界を打ち破るだけでなく、データ駆動型モデルのリアルタイム性と高精度性の利点を最大限に活用し、世界の天気予報技術に新たなパラダイムを切り開きます。

Aardvark Weather: 必要な計算能力が少なく、予測速度が数十倍向上

Aardvark Weather は、革新的なディープラーニング駆動型のエンドツーエンドの天気予報システムです。そのコア アーキテクチャは、エンコーダー モジュール、処理モジュール、デコーダー モジュールの 3 つのモジュールで構成されています。このシステムは、導入段階では従来の数値天気予報製品への依存をなくし、トレーニング段階では高品質の過去の再解析データを最大限に活用してモデルのパフォーマンスを向上させるように設計されています。

エンコーダーは、グリッド化データと非グリッド化データの両方のマルチソース観測データを統合して、初期の大気状態を生成する役割を担います。このプロセスでは非再帰的な方法を使用するため、従来の数値天気予報におけるカルマン フィルタの再帰更新で発生する可能性のある勾配不安定性などの問題を効果的に回避できます。処理モジュールは、初期状態に基づいて 24 時間の予測を生成し、自己回帰メカニズムの助けを借りてそれをより長いリード タイムに拡張します。デコーダーは、グリッド予測をローカルサイト予測に変換し、マルチタスク拡張をサポートし、システムの適用範囲をさらに拡大します。

アードバークの仕組み

モデル アーキテクチャの点では、エンコーダーと処理モジュールはビジュアル トランスフォーマー (ViT) をバックボーンとして使用し、デコーダーは軽量畳み込みネットワークを使用します。この組み合わせにより、処理効率とモデルの柔軟性の両方が保証されます。トレーニング戦略の点では、Aardvark はまず、観測バイアスを修正する方法を学習するための事前トレーニングに高忠実度の履歴再解析データ (ERA5 など) を使用し、次に段階的な微調整を通じて各モジュールを最適化して、トレーニングと展開の間の一貫性を確保します。最後に、共同微調整により、特定の地域や変数の予測精度をさらに向上させることができます。このモジュール設計とトレーニング方法により、Aardvark は導入時に従来の数値モデルから完全に独立し、データ駆動型モデルのリアルタイム性と高精度性の利点を最大限に活用できるようになります。

研究チームは、Aardvark Weather の世界規模のグリッド予測パフォーマンスを評価するにあたり、それを 4 つのベースライン モデルと比較しました。最も単純なベースラインは持続性と時間別気候であり、これらは予報システムに基本的な機能があるかどうかを評価するために使用されます。より難しい比較は、最も広く使用されている 2 つの運用決定論的全球 NWP システム、すなわち高解像度 HRES を備えたヨーロッパ中期予報センター (ECMWF) の統合予報システム (IFS) と米国国立環境予測センターの全球予報システム (GFS) の比較です。結果によると、Aardvark はほとんどのリードタイムにおいて GFS と同等かそれ以上の性能を発揮します。さらに、ほとんどの変数において、Aardvark のパフォーマンスは HRES のパフォーマンスに近いです。 Aardvark は、上層大気やリード タイムが短いほど誤差が大きくなりますが、これは地表近くで観測がより集中しているためと考えられます。リード タイムが長い場合、Aardvark の予報はスペクトル的にぼやける傾向があり、これはデータ駆動型の天気予報システムでは一般的な現象です。

研究結果では、Aardvark Weather が、初の完全なエンドツーエンドのデータ駆動型天気予報システムとして、生の観測データから予測出力への直接マッピングを学習することも示されています。展開時には NWP 製品から完全に独立しており、予測を生成するために観測データのみに依存します。生成速度は既存のシステムよりも数桁高速です。 Aardvark Weather システムは、4 つの NVIDIA A100 GPU で観測データから完全な予報を生成するのに約 1 秒しかかかりません。比較すると、従来のヨーロッパ中期予報センター (ECMWF) 高解像度 (HRES) システムでは、データ同化と予報を実行するだけで約 1,000 ノード時間が必要です。使用される観測データの量はビジネスベースラインより桁違いに少なく、コンピューティングリソースの要件も従来の方法より桁違いに少ないにもかかわらず、Aardvark は、現在でも 1.5 度のグローバル グリッドで予報を生成しており、複数の変数とリード タイムにわたる二乗平均平方根誤差 (RMSE) において運用中の NWP システムよりも優れています。

ERA5データセットに基づくグリッド化された世界予測のパフォーマンス分析

AIは数値天気予報の分野で広く利用されている

現在、世界の気象科学は人工知能技術が主導するパラダイムシフトの真っ只中にあり、我が国の科学研究力は、この技術革命において力強い突破力を発揮しています。ディープラーニングアルゴリズムの反復的なイノベーションに依存して、国内の研究機関は、気象予報の全チェーンをカバーするインテリジェントモデルシステムを構築しました。予測の精度と効率が大幅に向上しただけでなく、気象学と AI の深い統合も促進しました。

たとえば、地球座標系に適応した世界初の3次元ニューラルネットワークモデルであるファーウェイのPangu気象モデルは、従来の数値予報の物理方程式への依存を打ち破りました。革新的な階層型時間領域集約戦略により、反復誤差の蓄積を効果的に抑制し、世界の中期天気予報の解像度を業界最高の 0.25° に達成します。復旦大学の Fuxi 気象モデルは異なるアプローチを採用し、マルチタスク学習フレームワークを通じて気象要素の共同予測を実現します。緯度加重損失関数の設計により、高緯度地域での予測精度の低下という業界の悩みを巧みに解決し、特に小規模から中規模の降水事象の予測精度を大幅に向上させます。

特殊予報の分野では、上海人工知能研究所の「風武」システムがマルチモーダル融合技術を採用し、台風進路の120時間予報の誤差を121.4キロメートルという画期的な精度にまで圧縮した。これは、ヨーロッパ中期気象予報センター(ECMWF)の293.8キロメートルの誤差と比べて飛躍的な進歩である。崂山実験室の「海に聞く」海洋予測モデルは、海洋力学の原理をニューラルネットワークアーキテクチャに革新的に組み込み、1/12°の解像度を持つ世界初のインテリジェント海洋環境予測システムを構築しました。

それだけでなく、  中国気象局が主導する「AI気象予報モデル実証プログラム」は、技術成果の変革を加速させている。 Fengqing、Fenglei、Fengshunシステムがリリースされました。これは、AI 技術が研究から応用へと移行することを示しています。その中で、「Wind and Thunder」システムは、物理的な誘導とデータ駆動のハイブリッド アーキテクチャの先駆者でした。この「数学的融合」という技術的道筋は、極端な気象現象の解釈における純粋な AI モデルの欠点を効果的に補います。「風清」大型モデルは、驚異的な3分速で15日間の世界予報を生成し、コア要素の有効予報時間を10.5日に延長します。構築中の「風順」季節毎の予報システムは、AI技術をより困難な気候予報の分野に拡張する始まりを示しています。

国内のAI気象大規模モデルの研究は技術検証からビジネス応用へと移行していますが、その高効率性と低コストという利点は、世界の天気予報に新たなパラダイムをもたらしています。しかし、物理的メカニズムの解釈可能性、データのリアルタイム性、極端な事象のモデリングは、依然として克服する必要がある困難な問題です。物理データ融合フレームワークの継続的な深化と学際的な協力の強化により、AI技術により、分単位の短期予報から季節単位の気候予報まで、天気予報はより高精度でより幅広い応用が可能な新しい時代へと進むと期待されています。