HyperAI超神経

計算効率が3000倍に向上しました!崂山実験室らは、数値海洋予測よりも優れた性能を持つ海洋環境の大規模インテリジェント予測モデル「温海」を提案した。

特色图像

海洋では、さまざまな時間的および空間的スケールの渦が活動しています。で、空間規模が 10 km から 100 km に及ぶ中規模渦は、海洋の運動エネルギーの主な運搬体です。これは、海流速度、温度、塩分濃度の短期的な変化を支配し、大気プロセスに重要な影響を及ぼします。したがって、中規模渦の正確な予測は、海洋活動や管理にとって重要であるだけでなく、天気予報の精度を向上させることにも役立ちます。

これまで、海洋学者は主に、膨大な物理方程式を数値的に解くことによって将来の海洋の変化を予測してきました。数値解析の過程では、グリッド解像度が高くなるにつれて計算負荷が急激に増加します。その結果、海洋の中規模渦を予測するには膨大な計算リソースが必要になります。近年、人工知能 (AI) は科学研究に新たな方法と強力なツールをもたらし、天気予報において重要な進歩を遂げました。しかし、既存の AI 大規模モデルには、海と空の相互作用の表現が不十分であったり、予測結果があいまいであったりするなどの問題が依然として残っています。これは、海洋環境の予測精度を向上させる上で課題となります。

これに対応して、崂山実験室の呉立新院士率いる研究チームは、中国海洋大学、中国科学技術大学、青島国世科技集団有限公司と協力し、海洋物理と人工知能を深く融合させ、海洋力学の理論を用いてニューラルネットワークアーキテクチャの設計を推進した。私たちは、地球全体の高解像度(1/12°)海洋環境インテリジェント予測モデル「Ask the Sea」を開発しました。

関連する研究結果は、「ディープニューラルネットワークによる渦巻く海洋の予測」というタイトルで、Nature Communications にオンライン公開されました。

研究のハイライト:

* 「Ask the Sea」モデルは海洋力学理論を利用してニューラルネットワークアーキテクチャ設計を推進します

* 「文海」大型モデルの予測性能は、フランスのメルカトル国際海洋センターが発表した数値予測システムよりも優れている

* 「文海」大規模モデルは数値予測モデルに比べて計算効率が3,000倍向上

用紙のアドレス:
https://www.nature.com/articles/s41467-025-57389-2

オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s

データセット: 海洋観測データをグラウンドトゥルースとして使用

この研究で使用されたデータは、主にモデルのトレーニングのための海洋と大気の再解析データと、モデルの予測能力を評価するための観測データです。再解析データには、フランスのメルカトル国際海洋センターの GLORYS 全球 1/12° 海洋再解析データと、欧州中期予報センターの ERA5 全球 1/4° 大気再解析データが含まれます。

基本的に再解析データを予測の初期フィールドとして使用する既存のAI気象モデルとは異なり、本研究では、海洋数値予測システムと整合した初期場と強制場を厳密に用いて大規模モデルを駆動し、海洋観測データを真値として用いている。海洋モデルと海洋数値予報システムの実際の予測能力を客観的に評価します。

初期の海洋フィールドはフランスのメルカトル国際海洋センターの GLO12v4 予報システムから取得され、大気予報フィールドはヨーロッパ中期予報センターの IFS HRES 予報システムから取得されます。観測データには、Argo で測定された水温塩分プロファイル、衛星リモートセンシングで測定された海面高度、漂流ブイで測定された海面温度と沿岸表面流速が含まれます。

モデルフレームワーク: 海洋ダイナミクス理論がニューラルネットワークアーキテクチャ設計を推進

既存の大規模 AI モデルには、海と大気の相互作用の表現が不十分であったり、予測結果があいまいであったりする問題があり、精密な海洋環境予測の実現に課題が生じています。海洋物理学と人工知能の深い統合により、ニューラル ネットワーク アーキテクチャの設計は海洋力学理論に基づいて行われ、既存の大規模 AI モデルの欠点を効果的に克服します。


「Wenhai」モデルは、バルク式をニューラル ネットワークに明示的に埋め込みます。海と空の間の運動量、熱、物質の交換を正確に特徴付け、海と陸の分布マスクを使用してモデルに地形と海岸の境界を認識する能力を与え、海洋状態の変化傾向を予測対象とすることで、モデルが急速に変化する中小規模のプロセスにさらに注意を払うようにし、ニューラルネットワークのハイパーパラメータを最適化することでダウンサンプリングプロセスにおける情報損失を減らし、海洋における中小規模のプロセスの忠実度を高め、微調整技術を使用して反復予測プロセスにおける累積誤差を改善します。

「海に問う」大型模型建築模型図

実験的結論:「文海」大型モデルの予測能力は数値海洋予測システムよりも優れている

海洋における小規模プロセスは非線形性が高く、予測可能性が低い。さらに、海洋観測はまばらで、同化システムによって与えられた初期フィールドは実際の海洋の状態から逸脱する。したがって、予測される小規模および中規模のプロセスが、場所と強度に関して実際の観測と完全に一致することを要求することは困難です。特に、「二重ペナルティ」問題が存在するため、二乗平均平方根誤差 (RMSE) などの従来のポイントツーポイント誤差指標は、高解像度予測システムのパフォーマンスを評価するのに適していません。なぜなら、そのような指標により、高解像度の予報システムの方が実際の海洋の状態をよりよく反映できるにもかかわらず、高解像度の予報システムのパフォーマンスが低解像度のシステムよりも悪く見えるようになるからです。

「二重ペナルティ」問題の図、出典: ECMWF

「文海」大規模モデルとGLO12v4数値予報システムを公平に比較するために、本研究では高解像度予報システムの「近傍評価」方式を採用した。観測値の周囲の一定範囲内の予測値を観測地点のアンサンブル予測値とし、その連続順位確率スコア(CRPS)を評価します。 2024年4月から11月までの予測結果によると、今後10日間の気温、塩分、流速、海面高度に関する「文海」大型モデルの予測性能は、GLO12v4数値予測システムよりも優れていることが示されています。同時に、「文海」大型モデルは数値予測モデルに比べて計算効率が3,000倍向上した。計算時間とエネルギー消費を大幅に節約します。

2024年4月から11月までの「Ask the Sea」大規模モデル(青線)とフランスのメルカトル国際海洋センターのGLO12v4数値予測システム(赤線)の予測結果の連続ランク付け確率スコア(CRPS、低いほど良い)。

(a) 温度プロファイル

(b) 塩分プロファイル

(c)海面温度

(d)海面異常

(e) 15mのゾーン速度と

(f) 15mの子午線方向速度。温度-塩分プロファイルは、垂直方向に平均された CRPS を示します。網掛けはブートストラップ法を使用して得られた 50% の信頼区間を示しています。