ヨーロッパの研究チームは、わずか20秒で15日間の予報を提供できる高解像度の地域海洋予報モデル「SeaCast」を提案した。

4ヶ月前

海洋予測システムは、船舶の安全、養殖管理、沿岸域のリスク予防と管理、海洋生態系のモニタリングといった分野において不可欠な支援的役割を果たしています。これまで、これらのシステムは主に物理方程式に基づく数値モデルに依存して運用されていました。コペルニクス海洋環境モニタリングサービス (CMEMS) 内の地中海予測システム (MedFS) を例に挙げると、このシステムは双方向結合波流数値モデルを採用し、水平解像度約 4 キロメートル (1/24°) で最大 10 日間の運用海洋予測を提供します。地中海地域では予測の基準として認められています。

しかし、高精度化には膨大な計算コストが伴うことがよくあります。MedFSは89個のCPUコアを必要とし、10日間の予報を完了し、141層にわたる海況フィールドを出力するのに約70分かかります。このような高い計算負荷は、迅速なシナリオシミュレーションやアンサンブル予報といった、高いタイムリー性が求められるアプリケーションへの適用を制限し、実際の運用における緊急ニーズに十分に対応することを困難にしています。

近年、機械学習に基づく気象予測は飛躍的な進歩を遂げています。Transformer、ニューラル演算子、グラフニューラルネットワークといった高度なアーキテクチャを活用することで、機械学習手法は地球規模において従来の数値予測と同等、あるいはそれ以上の性能を達成しています。しかし、これらの成功事例を高解像度の地域海洋予測シナリオに適用するには、多くの課題が伴います。陸と海の不規則な分布、複雑な横方向の境界条件、および垂直成層変数の詳細な特性評価の必要性により、既存の地球規模の海洋 AI モデルを地域のタスクに直接適応させることは困難です。

この技術的ギャップを解消するために、フィンランドのヘルシンキ大学、地中海気候変動研究センター、イタリアのサレント大学からなる共同研究チームが…地域海洋予測用に特別に設計された SeaCast と呼ばれるグラフニューラルネットワークモデルが開発されました。このモデルは、技術アーキテクチャにおいていくつかの重要な進歩を遂げました。グラフの構築、トレーニング、評価プロセスを最適化することで、海洋グリッドの不規則な幾何学的構造に正確に適応できます。海面近くの重要な大気強制場データを導入することで、予報の物理的相関性を高めることができます。側方境界強制を組み合わせることで、海水の流入と流出のプロセスを正確に特徴付け、地球規模の海洋循環システムとの整合性を確保し、それによって高精度の海洋状況予測を実現します。

研究のハイライト:

* この研究では、グラフニューラルネットワークに基づく高解像度の地域海洋予測機械学習モデルである SeaCast を提案します。

このモデルは、過去の再解析データと解析データから直接学習し、地中海の主要な要素を予測します。すべての垂直レベルとすべてのシミュレーション要素において、運用中のMedFSモデルを上回る性能を発揮します。

* モデルのトレーニング後、1/24° グリッドで 18 の垂直レベルにわたる 15 日間の予報を単一の GPU でわずか 20 秒で完了できます。これは、CPU クラスターで実行される物理ベースモデルよりもはるかに高速です。

用紙のアドレス:

https://www.nature.com/articles/s41598-025-31177-w

その他の論文を見る:https://hyper.ai/papers

データセット: 海洋状態、大気力、側方境界、衛星検証データ

この研究で構築されたデータセットは、海洋の状態、大気の強制、横方向の境界の強制、衛星観測の 4 つの主要カテゴリをカバーしています。SeaCast モデルのトレーニング、検証、テストのためのシステムサポートを提供します。

海洋状態データは主に地中海海洋物理分析および予測システムから取得されます。このシステムは、NEMO v4.2海洋モデルとWAVEWATCH III v6.07波浪モデルの双方向結合に基づいて構築されています。シミュレーション精度を向上させるため、このシステムは3次元変分同化スキームOceanVarを採用し、現地観測データと衛星リモートセンシングデータを効果的に融合しています。研究チームは、モデリングのために200メートル以下の間隔で18の深度を選択し、地形データはGEBCO全球地形データベースから双線形補間によって取得しました。

モデルは、35年間（1987～2021年）にわたる地中海再解析の日々の平均データを用いて初期学習され、その後、2022～2023年の運用解析データを用いて微調整されました。この微調整は、モデルが最近の海洋状況を学習し、解析フィールドを初期条件として運用シナリオの要件に適応し、MedFS運用システムの更新に対応できるようにすることを目的としていました。モデル検証には2024年1月から6月までの解析データ（177サンプル）が使用され、テストデータは2024年7月初旬から12月末までの毎日の初期化予報で構成されていました。各初期化では15日間の予報が生成され、予報スキルの評価はSeaCastの予報リードタイムを完全にカバーするために2025年1月14日まで継続されました。

研究チームは、風成分から計算された2メートルの気温、海面気圧、10メートルの風応力成分を大気強制力に組み込みました。トレーニングフェーズ中の大気データは、ERA5再解析データの6時間データから生成され、日平均値に集約されました。テストフェーズでは、ECMWFアンサンブル制御予報（ENS）と人工知能予報システム（AIFS）の6時間集約日次予報を用いて、異なる大気強制力の影響を比較しました。モデルは、短期的な傾向を捉えるため、連続する3つのタイムステップからなるスライディングウィンドウを大気強制力の入力として採用しました。

さらに、研究チームは、ジブラルタル海峡域（西経5.2度以西）とダーダネルス海峡域（北緯39.9度から40.4度、東経25.9度から26.4度）をモデルの開放側方境界と定義し、MedFSまたは全球海洋予報データを用いて動的境界力を与えた。コペルニクス海洋予報製品は通常10日間のリードタイムであるのに対し、本研究では15日間の予報基準を使用していることを考慮すると、研究チームは革新的な外挿法を使用して、境界領域の最後の予測状態を 5 回連続して外挿しました。横方向境界強制場のエージング時間は巧みに延長され、エージングプロセス全体を通じて境界の一貫性が確保されます。

衛星データは主にモデル予測の検証と誤差評価に使用され、海面温度と海面異常の 2 種類のデータをカバーします。海面水温は、コペルニクスL3Sマルチセンサー融合プロダクト（日周スケール、1/16°解像度）を用いて測定しました。日周加熱の影響を排除するため、夜間観測のみを組み込んでいます。検証では、比較のためにモデル予測をL3Sグリッドに再サンプリングしました。海面水位偏差は、複数の高度計衛星からの5Hz観測データを統合したコペルニクスレベル3準リアルタイムプロダクトを用いて測定し、ノイズを低減するためのフィルタリングを行いました。モデルから出力された海面高度は偏差に変換され、その後、双線形補間によって衛星軌道座標にマッピングされ、検証に使用されました。

SeaCast: グラフニューラルネットワークに基づく高解像度地域海洋予測モデル

SeaCast は、地中海地域向けに特別に設計されたデータ駆動型の海洋予測モデルであり、1/24° (約 4 km) の水平グリッド上の 18 の垂直レベルにわたって最大 15 日間の海洋予測を提供できます。その空間解像度は運用中の MedFS システムと一致しており、垂直成層帯状流、子午線流、塩分、温度、海面高度など、合計 73 の予測フィールドをカバーする変数を予測できます。

このモデルの最も顕著な利点は、その計算効率です。SeaCast は単一の GPU で、わずか 20 秒で 15 日間の完全な予報を完了します。対照的に、MedFSは120秒のタイムステップで141層の鉛直予測結果を出力するのに89個のCPUコアを必要とし、10日間の予測を生成するのに約70分かかります。両者の動作は根本的に異なりますが、高解像度の上層海洋予測においてデータ駆動型手法の効率性は明らかです。

SeaCastは、地中海の特徴に適応した階層的なグラフグリッド上で動作する、エンコード・処理・デコード方式のアーキテクチャを採用しています。下図に示すように、入力となる海洋状態と大気強制場は、まず粗解像度のマルチスケールグリッド表現にエンコードされます。その後、グラフニューラルネットワーク層がこれらの潜在的特徴を階層的に処理することで、モデルは海洋の短距離および長距離の相互作用を効果的に捉えることができます。処理された出力は、元の高解像度グリッドにデコードされます。

*SeaCast は、自己回帰海洋予測にグラフニューラルネットワークを使用します。*

次の瞬間の状態を直接予測するのとは異なり、このモデルは、日周スケールにおける海洋状態の変動傾向の学習に重点を置いています。予測された変化を現在の状態と重ね合わせ、動的境界条件を組み込むことで、次のタイムステップにおける完全な予測を生成します。この状態はモデルへの新たな入力として使用され、自己回帰ループを通じて異なる時点における予測が可能になります。GraphCastなどのマルチスケールモデルでは、単一のグリッドレイヤー内でのみノードが接続されますが、本研究で用いられる階層的アプローチでは、予測領域を複数の独立したグリッドレイヤーに分割することで、グリッドとグラフ間の接続性をより均一化し、ノード近傍のサイズの違いによるシミュレーションバイアスを効果的に低減します。

大気強制場は、10メートルの風応力成分、2メートルの気温、平均海面気圧、そして季節指標としての年間積算日数の正弦値と余弦値など、大気条件に対する海洋の応答を完全に考慮します。トレーニングフェーズでは、ジブラルタル海峡とダーダネルス海峡の境界域の予測条件に実際の値を重ね合わせ、評価フェーズではこれをMedFS予測データに置き換えることで、開放境界条件に対応し、より現実的な海水の流入・流出の動的プロセスを確保します。

SeaCastモデルは、まず35年間の日次再解析データを用いて200ラウンドの事前学習を行い、その後2年間の解析データを用いて30ラウンドの微調整を行いました。事前学習は、64基のAMD MI250x GPUを用いて20.5時間（1312 GPU時間）データ並列処理で実行され、微調整は8基のGPUを用いて3.5時間（28 GPU時間）実行されました。

SeaCast の予測能力は MedFS モデルよりも優れています。

SeaCastモデルの予測性能を評価するため、多次元実験を実施しました。MedFSをベンチマークとして、高温極端現象の特定、大気強制力の影響、トレーニング期間といった主要分野における予測能力を評価するための制御実験を設計しました。

SeaCast と MedFS の比較実験では、MedFS の予測リードタイムは 10 日でした。SeaCast は、15 日間に延長された ECMWF の大気製品を統合し、横方向の境界を外挿することで、15 日間の海洋予報を実現しました。実験では、帯状流、子午線流、塩分、水温、海面水温、海面水位偏差の6つの因子を選択しました。持続性ベースラインを下限として、層別検証を採用しました。結果は下の図に示されています。SeaCast は全体的に MedFS を上回っており、予測のリードタイムが長くなるにつれてその差は広がっています。垂直成層により、温度と海流の利点は海面近くで最も顕著である一方、塩分の最適な効果はより深い水域で観察されることがわかります。水深 192 メートルのみ、SeaCast は MedFS を大幅に上回りませんでしたが、これはより深いプロセスが考慮されなかったことに関係している可能性があります。

*SeaCast、MedFS、および永続ベンチマークモデルにおける予測誤差の変動*

極端な現象を特定するために、研究者たちは海洋熱波の定義に基づき、衛星データに基づいて海面水温の90パーセンタイル値を計算し、極端な気温現象の閾値を定義しました。結果は下の図に示されています。SeaCast と MedFS はどちらも、認識機能の点では持続性ベンチマークを大幅に上回りましたが、SeaCast の方がわずかに優れていました。15 日間の予報リードタイムにより、早期警告のための時間がより多く得られます。

研究者らは、トレーニング期間と微調整の影響を評価するために、様々なバリエーションの実験を設計しました。結果は下の図に示されています。帯状流、子午線流、水温、海面水温については、わずか10年間の再解析データでトレーニングしたモデルでもMedFSと同等の性能を示しました。しかし、塩分と海面水位異常については、MedFSを上回るには35年間のデータに加え、微調整が必要でした。海面水位異常については、検証データのスパース性に起因する可能性もあるため、微調整による改善は限定的でしたが、他の要素については、微調整後のモデルが微調整前のモデルよりも優れた性能を示しました。この知見は、過去のデータが限られている地域にとって重要な意味を持ちます。わずか 10 年間の再解析と低コストで、数値モデルに匹敵するパフォーマンスを持つ機械学習予測モデルをトレーニングできます。

*異なる予測リードタイムにおけるベースラインモデルと比較したSeaCastバリアントとMedFSの正規化RMSEの差*

AIを活用した海洋予測：世界の学術界と産業界による探究と実践

世界的に、産学連携はかつてないほど深く広範囲に展開し、人工知能と海洋予測技術の統合と革新を推進しています。数々の代表的な研究成果と運用システムが、この分野の技術展望を大きく変えつつあります。

その中で、欧州中期予報センター（ECMWF）は、世界の中期予報の権威ある機関として、従来の数値予報システムIFSを継続的に最適化しながら、...近年、AIFS人工知能予測システムが立ち上げられ、運用段階に入りました。ECMWF がこのデータ駆動型フレームワークを地球システムモデルに拡張し、海洋、海氷、海洋波などのコンポーネントの機械学習モデリングに重点を置いていることは注目に値します。

一方、NVIDIA の Earth-2 イニシアチブは、気候と海洋のシミュレーション分野におけるこのテクノロジー大手の戦略的動きを示すものです。 Earth-2 は単一のモデルではなく、地球規模の天気予報、気候シミュレーション、生成 AI ダウンスケーリング、データ同化を網羅したフルスタックテクノロジープラットフォームです。そのコアコンポーネントの 1 つである FourCastNet は、Transformer に基づく初期のグローバル予測モデルとして、従来の数値モデルに匹敵する予測スキルを実現しています。

さらに、Google ResearchのNeuralGCMは、ハイブリッドモデリング手法の積極的な探求を示しています。このモデルは、微分可能な大気力学コアと、機械学習に代わるサブグリッド物理パラメータ化スキームを組み合わせ、数十年にわたる安定した気候シミュレーションを可能にします。

これは、人工知能が海洋予測の中核部分に徐々に組み込まれ、補助ツールとしての役割を超えつつあることを示しています。物理モデルの補足として、エンドツーエンドの代替手段として、あるいはハイブリッド形式で統合される場合でも、データ駆動型アプローチの価値は理論検証の域を超え、実用化や産業応用の瀬戸際にあります。今後、マルチモーダル観測データの継続的な蓄積と、生成型AIと物理メカニズムのさらなる融合により、海洋予測技術は精度、適時性、解釈可能性の新たなバランスを実現し、科学研究と産業応用のためのより強固な技術基盤を提供することが期待されます。

参考リンク:
1.https://mp.weixin.qq.com/s/dlEDxumoeTCkfkgY2s7V2g
2.https://mp.weixin.qq.com/s/dqhe6tWYrYvh06HTepsFpw