Apprentissage Automatique Vs Modèles Dynamiques : Les Dernières Recherches d'Ai2 : ACE2 Peut Réaliser Une Prévision Saisonnière Sur 4 mois En Seulement 2 minutes.

De la planification de l'irrigation des terres agricoles à la prévention et au contrôle des catastrophes liées aux vagues de froid, les prévisions météorologiques saisonnières sont cruciales pour la prévention et l'atténuation des catastrophes, la production agricole et la planification énergétique. Pendant longtemps, ces prévisions reposaient sur des modèles dynamiques basés sur des équations physiques. Cependant, grâce aux progrès de l'IA, les modèles d'apprentissage automatique rivalisent désormais avec les modèles traditionnels sur des indicateurs clés, atteignant même une précision supérieure dans certains scénarios.
Le principal avantage des modèles d’apprentissage automatique est la « prévision autorégressive » :La simulation de l'évolution atmosphérique à court terme sur une période de 1 à 6 heures, puis l'intégration des résultats de prévision dans le modèle, génèrent des prévisions multi-journalières de haute précision. Certains modèles peuvent prévoir avec précision sur plusieurs semaines, et les prévisions d'ensemble à grande échelle peuvent également améliorer la capacité à prédire la probabilité de phénomènes météorologiques extrêmes. Cependant, des obstacles importants subsistent : les prévisions dépassant plusieurs semaines sont sujettes à une stabilité réduite et à une perte de détails, ce qui complique le respect des exigences saisonnières en matière d'échelle de temps. De plus, les mécanismes physiques des modèles sont difficiles à interpréter et la taille de l'échantillon de prévisions saisonnières est réduite (un seul échantillon indépendant par an). L'utilisation de données de simulation de modèles physiques pour élargir l'ensemble d'entraînement comporte également des erreurs inhérentes.
C'est dans ce contexte technique queUne équipe de recherche composée du Met Office Exeter Hadley Centre, de l'Université d'Exeter et de l'Allen Institute for Artificial Intelligence (Ai2) aux États-Unis a évalué le modèle météorologique d'apprentissage automatique ACE2 précédemment développé et l'a comparé au modèle dynamique GloSea.Les résultats montrent qu'ACE2 peut maintenir la stabilité des prévisions autorégressives à long terme et offre un potentiel préliminaire pour les prévisions saisonnières sans couplage océan-air complexe, simplement en apprenant l'évolution atmosphérique à partir des données historiques d'ERA5. Cette étude confirme pour la première fois queLes modèles d’apprentissage automatique peuvent générer des prévisions saisonnières mondiales hautement qualifiées, offrant de nouvelles orientations pour le développement de technologies de prévision climatique à court terme.
Les résultats de recherche pertinents ont été publiés dans npj Climate and Atmospheric Science sous le titre « Prédictions saisonnières mondiales habiles à partir d'un modèle météorologique d'apprentissage automatique formé sur des données de réanalyse ».

Adresse du document :
Suivez le compte officiel et répondez « ACE2 » pour obtenir le PDF complet
Autres articles sur les frontières de l'IA :
Ensemble de données : Intégration de données multi-sources pour l'évaluation du modèle de prévision saisonnière
Cette étude intègre des données multi-sources pour appuyer l'évaluation du modèle de prévision saisonnière. Les principales sources de données et méthodes de traitement sont les suivantes :
Les données atmosphériques historiques de base sont tirées de l'ensemble de données de réanalyse ERA5,Pour assurer la stabilité de la température de surface de la mer (SST) et des conditions de glace de mer tout au long de la période de prévision, l'étude a appliqué un filtre de moyenne mobile gaussien avec un écart type de 10 jours à chaque cellule de la grille sur la base de données atmosphériques brutes à une résolution de 6 heures pour construire un champ de fond climatique qui combine les caractéristiques de variation saisonnière avec la stabilité des conditions aux limites.
Les données d'observation des précipitations mensuelles proviennent de l'ensemble de données du Global Precipitation Climatology Project (GPCP) v2.3.Fournir une référence d’observation pour vérifier les résultats ultérieurs des prévisions de précipitations.
Les données du modèle dynamique traditionnel utilisées pour la comparaison proviennent du système opérationnel de prévision d'ensemble GloSea (configuré en GC3.2), à partir de données rétrospectives initialisées annuellement de 1993 à 2015. Ce système comprend 63 membres d'ensemble, initialisés en trois lots (21 membres chacun les 25 octobre, 1er novembre et 9 novembre de chaque année). La dispersion d'ensemble est générée selon un schéma de physique stochastique. Ses simulations ont un horizon de prévision de six mois, avec une résolution d'environ 0,5° pour l'atmosphère et 0,25° pour les océans. Le modèle comporte 85 niveaux verticaux pour l'atmosphère (s'étendant jusqu'à 85 km dans la stratosphère) et 75 niveaux verticaux pour les océans. Il offre d'excellentes performances pour les prévisions subsaisonnières à saisonnières dans les régions tropicales et de latitudes moyennes, ce qui en fait un modèle dynamique de pointe dans ce domaine.
Pour unifier la référence de comparaison des résultats prévisionnels,Toutes les données de réanalyse ERA5 et les données du modèle GloSea de cette étude ont été converties dans la grille native 1°×1° d'ACE2 par interpolation bilinéaire, et seules les données de précipitations ont été interpolées dans une grille 2,5°×2,5°.Afin de quantifier avec précision les principaux signaux climatiques, l'étude a défini et validé des indices climatiques fondamentaux. Les événements ENSO ont été déterminés à l'aide de l'indice Ocean Niño (ONI) de décembre à février (DJF), avec un seuil de ± 0,5 K. Huit hivers El Niño et neuf hivers La Niña ont été identifiés. L'indice NAO est défini comme la différence de pression au niveau moyen de la mer entre la région nord-sud (20°N-55°N et 55°N-90°N).
Lors de la phase de sélection de l'ensemble et d'évaluation des performances des prévisions, cette étude a sélectionné des membres à partir d'une fenêtre temporelle d'initialisation spécifique afin de garantir la comparabilité : les membres initialisés par ACE2 du 28 octobre au 1er novembre (n = 20) et les membres initialisés par GloSea le 1er novembre (n = 21). Les valeurs NAO ont été agrégées en une moyenne climatologique sur 5 jours, et l'état moyen climatologique a été supprimé. L'étude a calculé l'erreur moyenne d'ensemble (RMSEₚ) et la dispersion (basée sur σᵢₚ). Les performances ont été évaluées du point de vue du rapport signal sur bruit à l'aide du rapport des composantes prévisibles (RPC), avec une signification testée à l'aide d'une méthode de rééchantillonnage aléatoire.
Mise en œuvre des prévisions saisonnières du modèle ACE2 : combiner les contraintes données et physiques
Le modèle atmosphérique d'apprentissage automatique ACE2 utilisé dans cette étude prend « la combinaison de contraintes physiques et basées sur les données » comme concept de conception de base.Entraîné exclusivement sur les champs atmosphériques de réanalyse ERA5, le modèle prédit avec précision l'évolution de l'état atmosphérique toutes les six heures avec une résolution de grille de 1° et maintient une excellente stabilité dans les prévisions autorégressives à long terme. Cette performance est due à trois caractéristiques de conception clés : une architecture d'opérateurs neuronaux de Fourier sphérique qui capture efficacement les schémas d'évolution atmosphérique dans l'espace sphérique ; des conditions aux limites de l'océan et de la glace de mer définies par l'utilisateur pour s'adapter à divers scénarios de prévision ; et des contraintes sur les processus physiques clés tels que la conservation de la masse, la circulation de la vapeur d'eau, le taux de précipitations et le flux de rayonnement pour garantir des prévisions physiquement cohérentes.
Dans les prévisions à l’échelle saisonnière, ACE2 utilise une méthode d’ensemble décalée pour générer les résultats de prévision.Durant la période 1993-2015, le modèle initialisait un membre de l'ensemble toutes les six heures, du 25 octobre au 9 novembre de chaque année, générant un total de 64 membres tout au long de l'année. Tous les champs d'initialisation étaient dérivés des données de réanalyse ERA5 afin de garantir l'authenticité des états initiaux. Les prévisions ont été maintenues depuis l'initialisation jusqu'à la mi-mars de l'année suivante, ce qui correspond à un horizon prévisionnel d'un à trois mois.
En termes de traitement des conditions aux limites, ACE2 utilise des données continues sur la température de la surface de la mer (SST) et les anomalies de la glace de mer.Basée sur l'anomalie instantanée de chaque cellule de la grille au moment de l'initialisation, combinée à un état climatique à 6 heures de résolution dérivé des données ERA5, cette anomalie est fixe tout au long de la période de prévision. Cette stratégie, contrairement aux conditions limites variables dans le temps utilisées lors de l'apprentissage, permet de réduire l'interférence causée par les fluctuations des limites dans les prévisions saisonnières. L'état climatique est basé sur 23 années de données ERA5, de 1994 à 2016, lissées par un filtre gaussien avec un écart type de 10 jours. La limite de la température de surface de la mer pour chaque cellule de la grille à l'instant t est calculée à l'aide de la formule. La concentration de glace de mer est traitée de la même manière, et le résultat est strictement limité à une plage raisonnable de 0 à 1.
De plus, le flux de rayonnement descendant à ondes courtes provenant de la partie supérieure de l'atmosphère et la concentration moyenne globale en CO₂ ont été modélisés à l'aide du modèle dynamique traditionnel GloSea afin de garantir des conditions limites cohérentes pour la comparaison. La sensibilité d'ACE2 à ces deux conditions limites nécessite des études complémentaires.
Pour évaluer la sensibilité de ces conditions limites, l'étude a mené plusieurs expériences contrôlées. En utilisant les données de 1988 à 2022 pour déduire l'état climatique, le coefficient de corrélation NAO était de 0,54 ; en utilisant le flux de rayonnement à ondes courtes de l'année précédente, le coefficient de corrélation NAO était de 0,43 ; et en utilisant les données de CO₂ de l'année précédente, le coefficient de corrélation NAO était de 0,38. Ces résultats sont cohérents avec un test de variabilité naturelle (où le coefficient de corrélation NAO était de 0,42 lorsque l'initialisation était retardée de 6 heures), indiquant qu'ACE2 est insensible à ces variations des conditions limites pendant la mission de prévision saisonnière en cours, démontrant ainsi une bonne stabilité des prévisions.
ACE2 démontre d'excellentes capacités de prévision basées sur seulement 6 heures de formation à l'évolution observationnelle
De nombreuses études ont confirmé que l’apprentissage automatique a non seulement favorisé l’innovation technologique dans les prévisions météorologiques à court terme, mais a également ouvert de nouvelles voies pour le développement de prévisions climatiques à court terme (échelle saisonnière).
Au cours de la période d'évaluation de 23 ans (1993-2015), comme le montre la figure ci-dessous, le modèle ACE2 a présenté des caractéristiques de distribution de compétences très similaires à celles du modèle dynamique traditionnel GloSea pour les prévisions saisonnières à horizon de 1 à 3 mois, avec des performances particulièrement élevées pour les prévisions de pression au niveau moyen de la mer (PSM). Il convient de noter que l'objectif principal de conception d'ACE2 est d'obtenir des simulations climatiques stables et qu'il n'a pas été spécifiquement optimisé pour les prévisions saisonnières. Par conséquent, cette cohérence des performances entre scénarios est plus précieuse à titre de référence. À l'instar de GloSea, la performance de prévision de la PSM d'ACE2 pour l'Europe est relativement faible, ce qui reflète les défis communs liés à la variabilité climatique complexe et aux difficultés de prévision dans cette région.

Quantitativement, le coefficient de corrélation d'ACE2 est légèrement inférieur à celui de GloSea dans la plupart des régions. Concernant les prévisions de température, comme le montre la figure ci-dessous, ACE2 maintient des capacités de prévision efficaces sur une large zone, couvrant l'Amérique du Sud, l'Afrique, l'Australie et certaines régions d'Amérique du Nord. Sa distribution des compétences est très cohérente avec celle des prévisions MSLP : le coefficient de corrélation moyen pondéré par la surface d'ACE2 pour la zone tempérée de l'hémisphère Nord est de 0,41 (celui de GloSea est de 0,45), tandis que pour les régions tropicales, il est de 0,68 et 0,77.

En matière de prévisions de précipitations, la performance globale des deux modèles est relativement faible. Comme le montre la figure ci-dessous, la distribution spatiale de la performance d'ACE2 reste remarquablement cohérente avec celle de GloSea, notamment dans les régions tropicales, les Caraïbes et l'Asie de l'Est. Ce résultat confirme la capacité d'ACE2 à prévoir la variabilité saisonnière dans plusieurs régions du monde.

Les deux types de modèles présentent également une complémentarité significative dans les prévisions NAO. Le coefficient de corrélation entre les prévisions NAO d'ACE2 et de GloSea n'était que de 0,34 (p = 0,11), mais après avoir calculé la moyenne d'ensemble des deux résultats, il est passé à 0,65 (p < 0,01), ce qui rend la précision comparable à celle de l'ensemble étendu de GloSea utilisant 127 membres. L'évolution de la dispersion et de l'erreur moyenne de l'ensemble, comme illustré dans la figure ci-dessous, montre également une forte cohérence entre les deux, confirmant ainsi la rationalité des prévisions d'ensemble d'ACE2.

ACE2 excelle également dans la capture des principaux modes climatiques, simulant la téléconnexion de l'oscillation australe El Niño (ENSO). Comme le montre la figure ci-dessous, en comparant les différences composites des champs climatiques entre les années El Niño et La Niña, on constate que les schémas de téléconnexion observés par ACE2 pour deux variables clés, la pression minimale de surface (MSLP) et la température de surface, concordent parfaitement avec les données de réanalyse ERA5 et les résultats de simulation GloSea.Il a été confirmé que même avec seulement 6 heures de formation sur l'évolution atmosphérique, ACE2 peut toujours identifier avec précision les signaux de variabilité interannuelle liés à ENSO dans plusieurs régions du monde.

Français Cependant, les limites d'ACE2 étaient évidentes dans ses prévisions de l'hiver extrême de 2009/2010 : sa moyenne d'ensemble ne reproduisait pas fidèlement l'anomalie négative de la NAO du MSLP, simulant seulement une pression arctique légèrement supérieure à la moyenne. Les simulations du vortex polaire stratosphérique étaient proches de la moyenne climatologique, tandis qu'ERA5 et GloSea ont montré un affaiblissement significatif du vortex polaire. Concernant les prévisions SSW, GloSea a capturé les effets renforçants de l'ENSO et du QBO d'est sur la probabilité SSW. ACE2 n'a montré des vents d'est stratosphériques que dans le membre 39%, sans différence d'occurrence climatologique par rapport au membre 40%. De plus, ses probabilités SSW simulées n'ont montré aucune différence statistique entre les années El Niño (45%), les années La Niña (36%) et les années neutres (41%), indiquant qu'elles ne capturaient pas entièrement la téléconnexion entre ENSO et la stratosphère.

L’avantage significatif des modèles d’apprentissage automatique se reflète également dans l’efficacité de calcul. ACE2 réalise une prévision saisonnière sur 4 mois en moins de 2 minutes sur un seul GPU NVIDIA A100.Une seule simulation d'un modèle dynamique traditionnel nécessiterait plusieurs heures d'exécution sur un supercalculateur. Cet avantage en termes d'efficacité ouvre de nouvelles perspectives d'innovation technologique en matière de prévisions saisonnières.
En résumé, la série de résultats de prévision ACE2 démontre pleinement que les méthodes d’apprentissage automatique ne sont pas seulement adaptées aux prévisions météorologiques à court terme, mais peuvent également ouvrir de nouvelles voies pour des avancées technologiques et des applications opérationnelles dans les prévisions climatiques à court terme, fournissant un soutien technique important pour les alertes aux risques climatiques dans le contexte du changement climatique mondial.
Collaboration universitaire et industrielle mondiale : l’IA transforme les prévisions météorologiques
Ces dernières années, le développement rapide des technologies d'intelligence artificielle transforme profondément le domaine des prévisions météorologiques, révélant notamment un potentiel considérable pour les prévisions saisonnières et climatiques. Les universités et les instituts de recherche continuent de réaliser des avancées en matière d'innovation théorique. Par exemple :Le cadre d’apprentissage automatique CERA développé par le Massachusetts Institute of Technology (MIT) offre une nouvelle voie pour la prévision climatique dans le contexte du réchauffement climatique.Ce cadre ne s'appuie pas sur des données étiquetées issues d'un scénario à fortes émissions de gaz à effet de serre. Il combine plutôt des données climatiques contrôlées avec des données climatiques chaudes non étiquetées, améliorant ainsi les capacités de généralisation du modèle dans des conditions climatiques inconnues. CERA capture non seulement l'évolution des tendances d'éléments climatiques clés tels que le transport d'humidité et les cycles énergétiques, mais restaure également la structure verticale et la distribution méridionale de la vapeur d'eau, démontrant ainsi une grande précision dans la prévision de la probabilité de précipitations extrêmes.
Le monde des affaires se concentre davantage sur la promotion de la mise en œuvre de la technologie et de l’amélioration de l’efficacité, et s’engage à intégrer des modèles d’apprentissage automatique dans les systèmes commerciaux réels.Le modèle GraphCast développé par Google DeepMind permet de générer à l'échelle de la minute des prévisions météorologiques mondiales sur 10 jours basées sur des réseaux neuronaux graphiques.Bon nombre de ses indicateurs de prévision ont dépassé les modèles numériques traditionnels du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT), fournissant ainsi un soutien important aux interventions d’urgence en cas de catastrophe.
Nvidia a lancé FourCastNet en collaboration avec la National Oceanic and Atmospheric Administration (NOAA) et d'autres agences.En s'appuyant sur les opérateurs neuronaux de Fourier pour obtenir une modélisation globale à haute résolution, le temps de prévision des conditions météorologiques extrêmes est de 12 à 24 heures plus tôt que les méthodes traditionnelles, ce qui permet de gagner du temps de réponse pour la prévention et l'atténuation des catastrophes.
À l’avenir, avec l’approfondissement de la collaboration interdisciplinaire, l’amélioration des ensembles de données météorologiques multi-sources de haute qualité et l’évolution continue du cadre de modélisation hybride « contraintes physiques + données », l’apprentissage automatique devrait devenir le cœur de la prochaine génération de systèmes de prévision climatique, fournissant un soutien scientifique plus fiable pour répondre au changement climatique, assurer la production agricole et renforcer les capacités de prévention des catastrophes.
Liens de référence :
1.https://mp.weixin.qq.com/s/Q5zJUwpeT88DvojgAA1afA
2.https://mp.weixin.qq.com/s/ZqlLWpoDSdFo82Qw44Sb3A