データの孤立/計算消費量/エラーの蓄積の問題を解決するために、上海人工知能研究所の Su Rui 氏は、FengWu-GHR で AI 天気予測において複数のブレークスルーを達成しました。

特色图像

「AI 手法が登場する前は、天気予報のスキルは 10 年ごとに 1 日向上する可能性がありました。しかし、AI の導入後は、天気予報のスキルは数か月で向上します。」

2024年北京インテリジェントソースカンファレンスの「科学のためのAI」フォーラムで、上海人工知能研究所の若手研究者スー・ルイ氏は、AI天気予報の歴史的発展を振り返り、この分野が直面する課題について詳しく議論し、包括的に議論した。氏は、彼のチーム FengWu-GHR の研究結果を紹介しました。

スー・ルイ先生のスピーチ

HyperAI は、Su Rui 氏の詳細な共有内容を、当初の意図に違反することなく編集してまとめました。AI 天気の最新開発を一緒に解読しましょう。

今日、私が皆さんと共有したいテーマは、「未来を探索し、天候を賢く制御する - 地球科学研究における人工知能の最先端の進歩」です。

いわゆる地球科学研究とは、主に大気圏、海洋圏、生物圏、岩石圏とそれらの間の相互作用、交換、循環プロセスの研究を指します。実際、大気や海洋の循環は、地球の気象、気候、生態系などに大きな影響を与えています。大気や海洋の変化をシミュレーション・解析し、天気や気候などを予測することは、地球の気象・気候・生態系などに大きな影響を与えます。人類の持続可能な発展。

AI 予測とデジタル予測の比較

これまで物理ベースのデジタル予測モデルは研究において大きな進歩を遂げてきましたが、その開発速度は依然として遅く、計算要件は非常に大きくなります。さまざまな分野でディープラーニングと人工知能の応用が成功したことにより、ますます多くの研究機関が天気予報にデータ駆動型の手法を使用しようと試み始めています。

AI気象大型モデルの開発経緯

例えば、国際的に認められた権威ある組織として、ヨーロッパ中期天気予報センター2018 年以来、気象予測にディープラーニング技術を使用する試みが初めて行われました。しかし、当時の気象データの解像度が低かったため、この試みの効果は平均的でした。

2022 年 2 月NVIDIA が FourCastNet 気象モデルを発表、初めて、0.25 度の高解像度気象データに基づいて予測が行われていますが、このモデルはまだ、欧州中期予報センターが使用する物理的なデジタル予報モデルを超えるものではなく、このモデルで予測できるのはわずかです。気象要素の数。

2022 年 11 月ファーウェイ、盤古気象モデルを発表高解像度の気象データに対するこのモデルのパフォーマンスは、欧州中期予報センターの IFS モデルのパフォーマンスを上回っていると主張され、これは大きな進歩であると見なされていました。

1ヶ月後、ディープマインド  同社は気象大型モデル「GraphCast」を発売し、このモデルの主な特徴は、よりさまざまな気象要素を予測できることです。

2023年4月私たちのチーム (上海人工知能研究所) は、独自の大型気象モデル FengWu を打ち上げました。以前のすべてのモデルと比較して、FengWu はパフォーマンスが大幅に向上しました。

AI を活用した FengWu モデルが最適な台風進路予測機能を実現

FengWu モデルのインスピレーションとなったローリング予測

地球を平面に展開し、その平面をグリッド化すると、地球規模の緯度と経度が 0.25° (約 25 キロメートルのスケールに相当) の空間分解能に分割されます。これは、世界が約 720 × 1440 のグリッド ポイントに分割され、各グリッド ポイントが垂直方向の高さで 37 の異なるレベルに分割され、温度、湿度、風速、海面温度、表面風速などの 169 の変数が含まれることを意味します。 。天気予報は、地球規模の気象要素フィールドに基づいて、気象要素フィールドの将来の変化を予測することです。

問題とモデル

私たちのチームは、過去 40 年間にわたる全球の気象要素フィールドの時間ごとのデータを分析し、各瞬間の全球気象要素フィールドが、実際には前の瞬間の要素フィールドの自然な注釈であることを発見しました。したがって、追加の注釈データを必要とせず、隣接する 2 つの時点間の気象要素フィールド間の関係を予測するだけで、気象要素フィールドの将来の変化を予測できます。これが FengWu モデルの最初のインスピレーションでした。

具体的には、FengWu モデルは次の瞬間の気象要素フィールドを予測した後、それを次の瞬間の気象要素フィールドを予測するための入力として使用する、という具合です。このようなローリング予報では、今後 14 日間に予測される気象要素フィールドを生成できます。

2 つの大きな利点: 長期的な事前予測スキル + 高い計算効率

FengWu モデルには 2 つの大きな利点があります。1つは、長期的な事前予測スキルを身につけることです。10.75 日の予測能力を達成できます。実際、AI 手法が登場する前は、物理ベースのデジタル予測モデルにより、予測スキルが 10 年ごとに平均 1 日向上しましたが、AI の導入により、予測スキルはわずか数か月で向上します。

FengWu の主な利点

FengWu モデルのもう 1 つの利点は、計算効率です。これまで、物理ベースのデジタル予測モデルでは、今後 10 日間の予測結果を生成するには、1 時間実行するために 10,000 個のコンピューティング ノードが必要でした。 FengWu モデルでは、GPU を 30 秒間実行するだけで、予測結果を同時に完了できます。これは、従来の方法より 2,000 倍以上高速です。

悲喜交々、台風予測におけるFengWuの利点と課題

台風進路予測におけるFengWuモデルの能力を評価するために、私たちのチームは2023年以降の台風データをテストに使用し、テスト結果を気象庁ヨーロッパ中期予報センターのテスト結果と比較しました。州気象局およびその他の機関。

台風進路予想

その結果、台風の進路を0~120時間前に予測すると、各ノードでは、FengWu モデルの台風の位置の予測誤差が最も小さくなります。

従来の物理的な方法と比較して、台風の強度を予測するという作業において、AIにはまだ欠陥がある。これは、AI 手法に基づく現在のすべてのモデルがデータ駆動型の方法でトレーニングされているためです。台風などの異常気象に関するデータは比較的少ないため、AI モデルは異常気象を予測する際に結果を平滑化する傾向があり、その結果、次のようなパフォーマンスが得られます。台風の強さの予測は弱いです。

FengWu-GHR: AI 予測解像度が初めて 0.09° に増加しました

緊急の解決策: 高解像度と長期にわたるエラーの蓄積

実際、FengWu モデルの開発完了後、気象分野の多くの専門家からフィードバックを受け取りました。フィードバックの 1 つは、FengWu は 0.25° の高解像度予測を達成できたものの、しかし、彼らは依然として、より高解像度の天気予報を取得したいと考えています。もう一つのフィードバックは、長期予測によって引き起こされる誤差の蓄積の問題はさらに解決する必要があります。

動機: 高解像度の天気予報が必要な理由

より洗練された高解像度の天気予報が必要なのはなぜでしょうか?

上海の表面温度グラフを例にとると、上海はそれほど大きくありませんが、地域ごとの温度差が明らかであることがわかります。南北距離が80kmしかない場合、0.25度の天気予報モデルを使って予測すると、3格子点程度のデータしか得られず、気象分布の詳細を記述するには不十分です。予測データの解像度が高くなると、大気の動きのより正確なシミュレーションが可能になり、より洗練された予測結果が得られます。

高解像度モデルのトレーニングが難しい理由

これに応えて、私たちは 0.09 度の高解像度で実装された初の AI 天気予報モデルである FengWu-GHR モデルをリリースしました。その具体的な実装プロセスは簡単ではありません。

まず、分解能を 0.25°から 0.09°に高めると、計算量とメモリ消費量が 80 倍以上増加します。第二に、高解像度の気象解析データは非常に希少ですが、AI モデルのトレーニングには大量のデータが必要となるため、高解像度の AI 気象モデルをゼロからトレーニングすることが非常に困難になります。

データを 2 つの部分に分割して、複雑な大気力学を高解像度で分解します。

これらの問題に対処するために、私たちは高解像度の大気の動きを 2 つの異なる部分に分解しようとしました。

まず、大量の低解像度データを使用してモデル (メタモデル) をトレーニングします。次に、高解像度の気象データが複数の低解像度の気象データに分解され、メタモデルを使用して各気象データが予測されます。最後に、これらの予測結果をつなぎ合わせて、高解像度の気象予測結果を取得します。

ただし、このようなアプローチでは、高解像度データの非線形関係を最大限に活用できません。したがって、これに基づいて、新しいモジュールと少数のパラメーターを導入し、高解像度領域間の非線形結合関係をより適切にキャプチャできるように、高解像度データを使用してモジュールをトレーニングしました。

ERA5で学習したメタモデルは高解像度データを直接扱えない

具体的には、上の図の左側にあるアイコンは元の高解像度フィールドであり、これが 4 つの異なる低解像度フィールドに分割され、言語モデルが結合された後、高解像度フィールドの予測に使用されます。解像度フィールドが取得され、最終的にその非線形性を捕捉するために新しいモジュールが追加されました。

累積エラーの処理

長期予測による累積誤差問題に対処する場合、Pangu は、各予測時点で個別のトレーニング モデルを使用してこの問題を解決します。これは非常に効果的な方法ですが、トレーニング コストが非常に高くなります。したがって、各ステップの予測プロセスに LoRA モジュールを追加し、少数のパラメーターを組み合わせて各ステップをトレーニングしました。これは、予測の各ステップの新しいモデルに相当しますが、参照する必要があるパラメーターは少数だけです。 、計算コストが大幅に削減されます。

モデル評価: FengWu-GHR は天気予報のさらなるアップグレードを実現

現在、0.09°の分解能結果を達成できるのは IFS のみであるため、テスト結果を検証するための参照標準として使用します。

IFSとFengWu-GHRのRMSEとACCの比較

その結果、FengWu-GHRはRMSEとACCの両方の指標において明らかな利点を示し、RMSEが低く、ACCが高いことがわかりました。

IFS と FengWu-GHR の間のバイアスとアクティビティの比較

FengWu-GHR の予測結果の偏差を測定するためにバイアス指標が使用され、テスト結果はより良好になります。アクティビティ インジケーターを使用して、予測時間が増加するにつれて予測結果があいまいになるかどうかを測定します。 FengWu-GHR の予測結果は徐々に滑らかになる傾向があり、モデルは異常気象予測に対する平滑化効果をまだ解決していないことがわかりました。

駅の評価

18,000 の異なる気象観測所からのフィールド データとリアルタイム観測データを分析することにより、2022 年 7 月から 12 月までのデータを使用してモデルをテストし、IFS_HRES および Pangu 大型モデルと比較しました。FengWu-GHR には、結果を何日前にも予測できるという利点があります。

熱波評価
コールドスナップの評価

また、FengWu-GHRは熱波予測や寒波予測にも非常に有利です。

今日は中期気象予報について話します。実際、大気分野では、1 ~ 3 日間の予報、長期の季節予報など、さまざまなスケールの予報に分かれています。現在は中期天気予報の能力に関する研究を中心に行っていますが、将来的には中期予報を気候レベルの予報にまで拡張できるかどうか、さらにはより詳細な研究を行っていきたいと考えています。気候の進化と将来の開発傾向を研究します。