HyperAIHyperAI

Le Modèle CoTCN Développé Par l'Institut De Physique Atmosphérique a Considérablement Amélioré La Précision Des Prévisions De Température De Surface De La Mer À l'échelle Mondiale, Avec Une Erreur De Prévision De La SST Sur 1 Jour De Seulement 0,2 °C.

特色图像

 

Lors de la conférence académique mondiale sur le calcul haute performance du CCF 2025, l'équipe dirigée par le chercheur Lin Pengfei de l'Institut de physique atmosphérique de l'Académie chinoise des sciences a rapporté un résultat de recherche important.L'équipe a développé avec succès le modèle d'apprentissage en profondeur CoTCN qui couple les frameworks Transformer et CNN.Des avancées ont été réalisées dans le domaine des prévisions à court terme de la température de la surface de la mer à l’échelle mondiale, fournissant un soutien technique essentiel aux prévisions de l’environnement marin.

HyperAI a compilé et résumé les propos approfondis du chercheur Lin Pengfei, sans en compromettre l'intention initiale. Voici la transcription de son discours.

Une architecture innovante résout les défis de la modélisation multi-échelle

Les changements de température de surface des océans sont étroitement liés à la circulation atmosphérique, aux précipitations terrestres, etc., et ont un impact important sur la sécurité du transport maritime, l’écologie de la pêche marine et la surveillance de l’environnement marin.Cependant, les modèles de prévision dynamique traditionnels présentent des problèmes tels qu’une vitesse de fonctionnement lente et un déploiement peu pratique, tandis que les modèles d’intelligence artificielle (IA) à architecture unique sont confrontés à des limitations telles que le manque de détails locaux ou la difficulté de modéliser les dépendances globales.En particulier dans les zones de tourbillons actifs à mésoéchelle telles que le courant de Kuroshio et le Gulf Stream, il a été constaté que l'erreur de température de surface de la mer des prévisions dynamiques et IA existantes dans les zones de tourbillons actifs est au moins 40% supérieure à la moyenne mondiale.
* Par exemple, le réseau de mémoire à long terme (LSTM), développé par le passé, permet de capturer efficacement les caractéristiques d'évolution des séries temporelles de la SST, de surmonter le problème de gradient nul des réseaux neuronaux traditionnels et d'obtenir des prédictions rapides et précises. Cependant, cette méthode manque encore d'explication physique, et sa prédiction des événements extrêmes dépend de la couverture des données d'entraînement.

est-ce que je: 10.3878/j.issn.1006-9895.2302.22128

Le discours a fait état du modèle CoTCN nouvellement construit.CoTCN adopte une architecture parallèle à double branche.Il combine intelligemment les capacités de modélisation globale de Transformer et les avantages d'extraction de fonctionnalités locales de CNN.

La branche 1 construit une pyramide de fonctionnalités multi-échelles basée sur Swin Transformer.La résolution est progressivement sous-échantillonnée de 720×1440 à 45×90, et les informations de différentes échelles sont intégrées via des connexions de saut.

La branche 2 utilise une structure d'encodeur-décodeur CNN spécifiquement responsable du maintien de la continuité spatiale et des détails locaux.Les deux branches sont fusionnées de manière adaptative grâce au mécanisme d’attention du canal, et le modèle peut déterminer automatiquement s’il faut s’appuyer davantage sur des informations globales ou sur des détails locaux dans différentes zones maritimes et à différentes échelles.

Les deux branches travaillent ensemble pour mettre en évidence les avantages de CNN et de Transformer et améliorer la précision des prédictions.

Architecture de réseau CNN couplé à transformateur (CoTCN)

Les performances surpassent les modèles existants dans tous les aspects

La recherche a été entièrement validée à l'aide des données océaniques mondiales NOAA OISST v2, couvrant une série chronologique de 40 ans de 1982 à 2022. Les résultats des tests sur une plate-forme informatique DCU nationale ont démontré que CoTCN présentait des avantages significatifs par rapport aux modèles traditionnels tels que ConvLSTM, ConvGRU, AFNO, PredRNN et SwinLSTM.

En termes de précision des prévisions, l'erreur quadratique moyenne (RMSE) sur 1 jour du CoTCN est d'environ 0,2 °C, et le coefficient de corrélation reste supérieur à 0,8 pour les prévisions à 10 jours. En comparant les indicateurs de prévision, le CoTCN affiche des performances stables dans des mesures d'évaluation telles que l'erreur quadratique moyenne (RMSE), l'erreur absolue moyenne (MAE), le coefficient de corrélation (ACC) et l'indice de similarité structurelle (SSIM). Plus important encore, le modèle est particulièrement performant dans les eaux complexes.L'erreur de prévision dans les zones actives de tourbillons telles que le courant de Kuroshio et le Gulf Stream a été réduite de 15-60%, alors que dans les eaux relativement calmes telles que les océans tropicaux Pacifique et Atlantique, les performances des modèles sont relativement proches.

Évolution des indicateurs de prévision des différents modèles

La puissance de calcul domestique permet une formation efficace

Cette recherche s'est entièrement basée sur des DCU domestiques pour la formation et la vérification, et a réalisé des expériences comparatives avec plusieurs modèles grand public dans un environnement de test avec 32 DCU et une seule carte avec 16 Go de mémoire.En termes d'efficacité de formation, CoTCN obtient de bons résultats, terminant la formation en seulement 5,93 heures à une échelle de paramètres de 68 millions.Le modèle AFNO, avec 106 millions de paramètres, a nécessité 8,33 heures, tandis que les modèles ConvGRU et PredRNN, en raison des limitations de la séquence RNN, ont nécessité respectivement 11,28 heures et 25,04 heures. Cela confirme non seulement le caractère avancé du modèle CoTCN, mais démontre également que la conception architecturale est plus cruciale que la simple augmentation du nombre de paramètres. Cela démontre également le rôle important des plateformes de calcul haute performance nationales dans le soutien de la recherche scientifique de pointe.

À propos du chercheur Lin Pengfei

Lin Pengfei est chercheur à l'Institut de physique atmosphérique de l'Académie chinoise des sciences. Il se consacre principalement au développement et à l'application de modèles océaniques. Il a développé le modèle national de circulation océanique globale (LICOM) et son modèle couplé. Ce modèle offre une résolution horizontale allant jusqu'à 1 km. S'appuyant sur LICOM, il a mis au point un système de prévision environnementale océanique haute résolution et mené des recherches sur la prévision intégrée dynamique intelligente en combinaison avec l'intelligence artificielle. À l'aide de modèles nationaux du système climatique, il a réalisé les propres expériences de simulation de super-ensembles de mon pays et mené des recherches approfondies sur les changements interdécennaux du système climatique. Il a publié plus de 50 articles en tant qu'auteur principal ou auteur correspondant dans des revues telles que Nature Communications et Science Bulletin. Il a présidé le projet du Programme national de recherche et développement (National Key R&D Program) et le projet pilote de l'Académie chinoise des sciences, et a participé au projet intégré et aux grands projets de la Fondation nationale des sciences naturelles. Il a remporté les prix annuels de la meilleure application en supercalcul de la China Computer Society en 2024 et 2025. Il a été sélectionné comme l'une des dix principales avancées scientifiques et technologiques météorologiques en Chine en 2024 et parmi les dix principales avancées scientifiques et technologiques dans les océans et les lacs de Chine.

Informations sur le document :
1. Un réseau couplé transformateur-CNN : amélioration de la précision des prévisions de température de surface de la mer. Transactions IEEE sur les géosciences et la télédétection, 63, 1–14.

https://doi.org/10.1109/TGRS.2025.3574990

2. Un nouveau réseau de transformateurs pour la prévision à court terme de la température de surface de la mer : importance des tourbillons. Télédétection, 17(9), 1507. 

https://doi.org/10.3390/rs17091507

3. Prévisions à court terme de la température de surface de la mer dans le Pacifique équatorial à l'aide d'un réseau de mémoire à long terme (LSTM). Journal of Atmospheric Sciences, 48(2), 745–754.

https://doi.org/10.3878/j.issn.1006-9895.2302.22128

Obtenez des articles de haute qualité et des articles d'interprétation approfondis dans le domaine de l'IA4S de 2023 à 2024 en un seul clic⬇️