大気物理研究所が開発した CoTCN モデルにより、世界の海面水温予測の精度が大幅に向上し、1 日の SST 予測誤差はわずか 0.2°C になりました。

特色图像

 

2025 CCFグローバルハイパフォーマンスコンピューティング学術会議において、中国科学院大気物理研究所の林鵬飛研究員率いるチームが重要な研究成果を報告した。チームは、Transformer と CNN フレームワークを組み合わせた CoTCN ディープラーニング モデルの開発に成功しました。世界の海面温度の短期予測の分野で大きな進歩が遂げられ、海洋環境予測に重要な技術的支援を提供しています。

HyperAIは、林鵬飛研究員の詳細な発言を、本来の意図を損なうことなく編集・要約しました。以下は、そのスピーチの書き起こしです。

革新的なアーキテクチャがマルチスケールモデリングの課題を解決

海面温度の変化は、大気循環や陸地降水量などと密接に関係しており、海洋船舶の安全、海洋漁業生態、海洋環境モニタリングに重要な影響を及ぼします。しかし、従来の動的予測モデルには、動作速度が遅い、展開が不便などの問題があり、一方、単一アーキテクチャの人工知能 (AI) モデルには、ローカル詳細の欠如やグローバル依存関係のモデリングの難しさなどの制限があります。特に黒潮やメキシコ湾流などの活発な中規模渦域では、渦活動域における既存の力学予測とAI予測の海面水温誤差が世界平均より少なくとも40%高いことが分かっています。
* 例えば、過去に開発された長短期記憶(LSTM)ネットワークは、SSTの時系列変化特性を効果的に捉え、従来のニューラルネットワークの勾配消失問題を克服し、高速かつ正確な予測を実現します。しかし、この手法は依然として物理的な説明が不足しており、極端な事象の予測はトレーニングデータのカバレッジに依存します。

土井: 10.3878/j.issn.1006-9895.2302.22128

講演では、新たに構築された CoTCN モデルについて報告されました。CoTCN はデュアルブランチ並列アーキテクチャを採用しています。Transformer のグローバル モデリング機能と CNN のローカル特徴抽出の利点を巧みに組み合わせています。

ブランチ 1 は、Swin Transformer に基づいてマルチスケール機能ピラミッドを構築します。解像度を720×1440から45×90まで段階的にダウンサンプリングし、スキップ接続により異なるスケールの情報を統合します。

ブランチ 2 は、空間の連続性とローカルの詳細を維持することに特に重点を置いた CNN エンコーダー/デコーダー構造を使用します。2 つのブランチは、チャネル アテンション メカニズムを通じて適応的に融合され、モデルは、異なる海域および異なるスケールで、グローバル情報に重点を置くか、ローカル詳細に重点を置くかを自動的に決定できます。

2 つのブランチが連携して、CNN と Transformer の利点を強調し、予測精度を向上させます。

結合トランスフォーマー-CNNネットワーク(CoTCN)アーキテクチャ

あらゆる面で既存モデルを上回るパフォーマンス

この研究は、1982年から2022年までの40年間の時系列をカバーするNOAA OISST v2全球海洋データを使用して完全に検証されました。国内のDCUコンピューティングプラットフォームでのテスト結果では、CoTCNがConvLSTM、ConvGRU、AFNO、PredRNN、SwinLSTMなどの主流モデルよりも大きな利点を示したことが実証されました。

予測精度に関しては、CoTCNの1日平均二乗誤差(RMSE)は約0.2℃であり、相関係数は10日間予測で0.8以上を維持しています。予測指標を比較すると、CoTCNは平均二乗誤差(RMSE)、平均絶対誤差(MAE)、相関係数(ACC)、構造類似性指数(SSIM)などの評価指標において安定したパフォーマンスを示しています。さらに重要なのは、このモデルが複雑な海域において特に優れた性能を発揮していることです。黒潮やメキシコ湾流などの渦活動域の予測誤差が15-60%減少しました。一方、熱帯太平洋や大西洋などの比較的穏やかな海域では、さまざまなモデルのパフォーマンスは比較的近くなります。

異なるモデルの予測指標の変化

国内のコンピューティングパワーが効率的なトレーニングをサポート

この研究は、トレーニングと検証に完全に国内のDCUをベースにしており、32個のDCUと16GBのメモリを搭載した1枚のカードを備えたテスト環境で、複数の主流モデルとの比較実験を完了しました。トレーニング効率の点では、CoTCN は優れたパフォーマンスを発揮し、6800 万パラメータの規模でわずか 5.93 時間でトレーニングを完了します。1億600万パラメータのAFNOモデルでは8.33時間を要しましたが、ConvGRUモデルとPredRNNモデルではRNNシーケンスの制限により、それぞれ11.28時間と25.04時間を要しました。これはCoTCNモデルの先進性を実証するだけでなく、パラメータ数を単純に増やすよりもアーキテクチャ設計が重要であることを示しています。また、最先端の科学研究を支える国内の高性能コンピューティングプラットフォームの重要性も示しています。

研究者 林鵬飛について

林鵬飛氏は、中国科学院大気物理研究所の研究員です。主に海洋モデルの開発と応用に従事しており、中国の国産全球海洋循環モデルLICOMとその結合モデルを開発しました。全球海洋モデルの水平解像度は最大1kmです。LICOMをベースに高解像度の海洋環境予測システムを構築し、人工知能と組み合わせたインテリジェントな動態統合予測研究を実施しました。国産の気候システムモデルを用いて、中国独自のスーパーアンサンブルシミュレーション実験を実施し、気候システムの数十年規模の変化について詳細な研究を行いました。Nature CommunicationsやScience Bulletinなどのジャーナルに、筆頭著者または責任著者として50本以上の論文を発表しました。国家重点研究開発計画プロジェクトと中国科学院パイロットプロジェクトを主宰し、国家自然科学基金統合プロジェクトと主要プロジェクトに参加しました。中国コンピュータ学会の2024年と2025年のスーパーコンピューティング年間最優秀アプリケーション賞を受賞しました。彼は2024年中国気象科学技術進歩トップ10、中国海洋湖沼科学技術進歩トップ10に選出された。

論文情報:
1. 結合トランスフォーマー-CNNネットワーク:海面温度予測精度の向上。IEEE Transactions on Geoscience and Remote Sensing、63、1-14。

https://doi.org/10.1109/TGRS.2025.3574990

2. 短期全球海面温度予報のための新たな変圧器ネットワーク:渦の重要性リモートセンシング、17(9)、1507。 

https://doi.org/10.3390/rs17091507

3. 長短期記憶ネットワーク(LSTM)を用いた赤道太平洋の海面水温の短期予測。大気科学ジャーナル、48(2)、745-754。

https://doi.org/10.3878/j.issn.1006-9895.2302.22128

2023年から2024年にかけてのAI4S分野の高品質な論文と詳細な解釈記事をワンクリックで入手⬇️