天気予報の主流は数値天気予報です。演繹的推論プロセスである数値積分を通じて、地球システムの状態をグリッドごとに解きます。
しかし、天気予報の解像度が向上し続け、予測時間が徐々に延長されるにつれて、NWP モデルに必要な計算能力が急速に増加し、その開発が制限されています。一方で、人工知能に基づくデータ駆動型の天気予報は急速に発展し、一部の分野では従来の手法を超えています。
既存の機械学習天気予報はどの程度正確ですか?人工知能は天気予報をどう変えるのでしょうか?この記事では、いくつかの主要なデータ駆動型機械学習天気予報モデルを比較し、天気予報の将来の発展についての展望を示します。
著者 | 雪才
編集者 | 三陽
数値天気予報 (NWP) は天気予報の分野で主流の手法です。アッベとビヤークネスは、20 世紀初頭に、人々は物理法則を使用して天気を予測し、現在の気象条件を初期値として取り込み、それらを統合することで将来の天気を解決できることを提案しました。しかし、当時の気象学の研究は十分に深くなく、計算レベルも比較的後進的であったため、このアイデアは実現できませんでした。
最初の電子コンピューターを使用した天気予報の最初の試みは、1950 年にプリンストン大学で行われました。 1954 年、ストックホルムで初めてリアルタイムの天気予報が実現されました。
各グリッドセルの物理法則に基づいて連立微分方程式を解きます。
1970年代までは、スーパーコンピューターの出現により、人々はアッベとビヤークネスによって提案された一連の方程式を解くことができるようになりました。。 1979 年、ヨーロッパ中期天気予報センター (ECMWF) が最初の中期天気予報をまとめ、統合予報システム (IFS) の章が始まりました。
しかし、エドワード N. ローレンツはこれまでの経験を次のように要約しました。気象システムはカオスシステムであると提案する、変数の小さな変化により、大きな変化が起こります。一方で、また、気象システムの初期状態を人間が完全に把握することは困難です。。この目的を達成するために、学術コミュニティはアンサンブル予測 (アンサンブル予測) を使用して、初期パラメーターと予測モデルの不確実性を最小限に抑えます。予測結果の収集が確率的予測の基礎となります。
降水確率のアンサンブル予報の模式図
数値モデル、スーパーコンピューティング、データ同化、アンサンブル予測などの技術の発展により、数値天気予報の精度は向上し続けており、予測時間は 3 ~ 5 日から 7 日、さらには 10 日まで徐々に長くなりました。。
南半球と北半球(南半球、ニューハンプシャー州)における天気予報技術の時間の経過に伴う進化
現在、欧州中期予報センターの予測モデルでは、各水平レイヤーの 200 万グリッドに対する 10 日間の予測を 10 分のステップ サイズで 1 日 2 回実行する必要があります。したがって、約 400 億グリッドの計算を 2.5 時間で完了する必要があり、高いコンピューティング コストが必要になります。
計算コストが高いため、数値気象予測手法のさらなる開発が妨げられている。モデルの解像度とアンサンブルのサイズの間のバランスを見つける方法が、アンサンブルの予測を制限する足かせとなっています。
最近、データ駆動型の機械学習 (ML) は、天気予報において大きな可能性を示しています。 2022 年以降、天気予報分野の機械学習モデルは一連の画期的な進歩を遂げており、その中には欧州中期天気予報センターの高精度予報に匹敵するものもあります。データ駆動型の天気予報推論は、統合予報システム (IFS) の物理モデルではなく機械学習モデルに依存しています。その予測速度は従来の方法よりも数桁高速です。。さらに、機械学習に基づく天気予報は、従来の演繹的推論ではなく、帰納的推論の結果です。このロジックのパラダイムシフトは、天気予報の解釈方法を変えます。これらの結果は以前のデータから学習されたものであるため、より説得力があります。。
気象学における大規模で高品質のオープン データセットのおかげでデータ駆動型モデルが出現。既存の機械学習天気予報モデルは、欧州中期天気予報センターの第 5 世代再解析データに基づいてトレーニングされています。ERA5再解析データセット。統合予報システム (IFS) の現行バージョンが 2016 年に発表されたとき、1940 年から現在までの気象データが再分析され、解像度 0.25° (30 km) の ERA5 データセットが作成されました。
2022 年、NVIDIA はフーリエ予測ニューラル ネットワークに基づく FourCastNet をリリースしました。解像度 0.25°の初のディープラーニング天気予報。
FourCastNet アーキテクチャ図
FourCastNet は解像度を向上させながら、異常相関係数 (ACC) と二乗平均平方根誤差 (RMSE) の点で従来の数値天気予報に大きく遅れをとっていません。
FourCastNetと数値天気予報のACCおよびRMSEの比較
ノード時間 (Node-Hour) では、FourCastNet は、従来の数値気象予測モデルよりも約 45,000 倍高速ですは、高解像度での精度と相まって、非常に大規模なアンサンブル予測のコストを急速に削減できます。
GraphCast は、グラフ ニューラル ネットワーク (GNN) に基づいたニューラル ネットワークです。「エンコード・処理・デコード」構成を採用、合計 3,670 万個のパラメーターがあります。
エンコーダは、単層 GNN を通じて入力グリッド内の変数を内部マルチグリッドにマップします。
マルチグリッドは空間的に均一なグラフです、地球規模で高解像度です。マルチ メッシュは、正二十面体 (12 個のノード、20 個の面、30 個のエッジを含む) の 6 回の反復によって形成され、各反復で 1 つの三角形が 4 つの小さな三角形に分割され、そのノードが球に投影されます。最終的なマルチグリッドには 40,962 個のノードが含まれます、およびリファインメントプロセスのすべてのグラフィックスのエッジが含まれ、異なる長さのエッジを含む階層グラフが形成されます。
プロセッサは 16 の非共有 GNN レイヤーを使用します、複数のグリッド上でメッセージを渡します。デコーダは単層 GNN を使用して、プロセッサが学習したマルチグリッドからの特徴を緯度と経度システムにマッピングします。
グラフキャストフレームワーク
ac: GraphCast の入力予測反復プロセス。
df: GraphCast のエンコード、処理、デコードの構成。
g: マルチグリッドリファインメントプロセス。
ヨーロッパの中期天気予報の高解像度予報 (HRES) の比較、GraphCast は ACC と RMSE の両方で優れています。
GraphCast と HRES の間の予測 RMSE (a&b) と ACC (c) の比較
32 台の Cloud TPU v4 デバイスで 3 週間トレーニングした後、GraphCast は 1979 年に遡る ERA5 データから学習しました。続いて、 GraphCast は、単一の Cloud TPU v4 デバイス上で、0.25°の解像度、60 秒以内に 6 時間間隔で 10 日間の天気予報を生成できます。
大規模な盤古気象モデルの入力と出力は 3 次元の気象場です。。気象場の経度と緯度の分布が不均一であるため、Pangu の大規模気象モデルは、3 次元の Vision Transformer (ViT) を使用して気象データを処理します。、その精度は初めて主流の統合予測システム(IFS)を上回りました。
3D ビジョントランスフォーマーのアーキテクチャ
予測時間が 3 日を超える場合、RMSE の観点から、Pangu大型気象モデルの性能はIFSと同等、トレーニングセットERA5よりも優れています。
T850とZ500の各モデルの予測性能の比較
a&b: 異なるモデルがそれぞれ T850 と Z500 を予測する場合の RMSE。
c&d: T850 と Z500 でそれぞれ異なるモデルによって予測された活動強度。
e&f: T850 と Z500 をそれぞれ予測する際の、さまざまなモデルの偏差。
要約すると、データ駆動型の機械学習天気予報は、予測精度の点では従来の数値天気予報モデルに近いですが、計算機器と計算速度は数値天気予報モデルをはるかに上回っており、AI 天気予報にはかなりの実用性があることが示されています。 。 潜在的。
屋内外の天気予報において、機械学習は驚くべきペースで進歩し続けています。。欧州中期天気予報センターは、NVIDIA、Huawei、Deepmind などのデータ主導型天気予報の急速な台頭を追ってきました。
「FourCastNet は、解像度 0.25° の初の AI ベースの天気予報システムであり、初のオープンソースの天気予報システムです。私たちの新しいバージョンは、モデルの中期的なパフォーマンスと長期的な安定性を大幅に向上させており、今後も活用していきたいと考えています」ニューラル コンピューティングをサブフレームワークに適用して超解像度を実現します」と NVIDIA Earth-2 チームの Anima Anandkumar 氏は述べています。
欧州中期天気予報センターは、これらの機械学習モデルを安定した数値モデルとともにユーザーに提示し、アプリケーション側からシステムの動作とパフォーマンスを評価するよう促しています。モデルの精度、信頼性、不確実性、対話性は、気象製品の品質と有効性を評価する際の重要な要素です。
この目的のために、欧州中期予報センターは、IFS 初期条件に基づいた FourCastNet、PGW、GraphCast の予測結果を公開しました。フロリアン・パッペンバーガー氏はこう語った。オープン性はイノベーション、コラボレーション、探求の鍵です。比較と分析のためのデータ、方法、結果を共有することで、科学の発展を加速し、最終的には社会に利益をもたらすことができます。」
3つの気象AIの公開データ
欧州中期天気予報センターとの比較では、AI ベースの天気予報は、パフォーマンスのいくつかの側面においてすでに数値天気予報に匹敵しており、将来的に重要な役割を果たすことがわかります。しかし、これらのモデルには、中長期的なスケールで価値のある予測を提供するための鍵となる、包括的な予測機能がまだ備わっていません。
オープンアクセス、比較の最適化、移植性、簡単なアクセスなど、AI の利点が従来の天気予報に浸透しつつあります。。 AI は天気予報をスーパーコンピューターから解放すると同時に、極端な気象現象に対しても優れたパフォーマンスを発揮します。 AIは数値天気予報と合わせて天気予報手法を革新し、農業、林業、畜産、漁業、航海、航空宇宙の発展に貢献できると考えられています。
参考リンク:
[1]https://journals.ametsoc.org/view/journals/mwre/29/12/1520-0493_1901_29_551c_tpbolw_2_0_co_2.xml
[2]https://cir.nii.ac.jp/crid/1573668925699683328
[3]https://www.nature.com/articles/nature14956
[4]https://arxiv.org/abs/2202.11214
[5]https://arxiv.org/abs/2212.12794
[6]https://phys.org/news/2023-09-ai-weather-showcase-data-driven.html
[7]https://arxiv.org/abs/2307.10128
- 以上 -