Nature, L'université De Cambridge Et D'autres Ont Publié Le Premier Système De Prévision Météorologique De Bout En Bout Basé Sur Les Données, Qui Augmente La Vitesse De Prévision De Dizaines De Fois

Chaque jour, à l'aube, des centaines de superordinateurs du monde entier découpent l'atmosphère en millions de cubes virtuels et déduisent la trajectoire de mouvement de l'atmosphère terrestre au cours des 10 prochains jours en résolvant un ensemble d'équations aux dérivées partielles impliquant la thermodynamique, la mécanique des fluides et le transfert de rayonnement. Cette technologie, appelée prévision météorologique numérique, est devenue la pierre angulaire des prévisions météorologiques modernes depuis que le météorologue britannique Richardson a proposé l'idée d'une « usine de prévisions météorologiques » au milieu du XXe siècle. De la prévision de la trajectoire des typhons à la planification des itinéraires de vol, des décisions d'ensemencement agricole à la planification de la production d'énergie nouvelle, l'instantané tridimensionnel de l'atmosphère mondiale mis à jour toutes les 6 heures par le système de prévision numérique remodèle la façon dont les humains communiquent avec la météo avec une résolution spatiale de 0,01° de longitude et de latitude (environ 1 km).
Cependant, face à des demandes sociales croissantes, les modèles de prévision numérique traditionnels basés sur des équations physiques sont confrontés au double dilemme d’une croissance exponentielle de la complexité de calcul et d’une diminution des avantages marginaux liés à une meilleure précision des prévisions.Dans ce contexte, l’intervention de la technologie de l’intelligence artificielle revient à installer un nouvel organe sensoriel pour la science atmosphérique. Lorsque les réseaux neuronaux profonds commencent à analyser les textures subtiles des images de nuages satellites, lorsque les algorithmes d’apprentissage par renforcement optimisent de manière autonome les schémas de paramétrisation et lorsque les réseaux antagonistes génératifs répètent les conditions météorologiques extrêmes dans des scènes virtuelles, une révolution technologique dans les prévisions météorologiques prend progressivement forme.
Récemment, l’Université de Cambridge, en collaboration avec l’Institut Turing, l’Université de Toronto, le Microsoft Science Intelligence Center, le Centre européen pour les prévisions météorologiques à moyen terme, le British Antarctic Survey et Google DeepMind, ont lancé conjointement un système de prévision météorologique de bout en bout basé sur les données appelé Aardvark Weather. En intégrant les données d’observation, le système peut générer simultanément des prévisions globales en grille et des prévisions locales sur site.Lors de tests portant sur plusieurs variables clés et différents délais, ses performances de prévision globale ont dépassé la référence traditionnelle de prévision numérique du temps (PNT) opérationnelle.Pour les prévisions de sites locaux, le système démontre une grande capacité de prévision avec un délai d'exécution allant jusqu'à 10 jours, et ses performances sont comparables à celles de la référence mondiale NWP optimisée grâce au post-traitement et aux systèmes de prévision de bout en bout avancés intégrant les contributions des prévisionnistes humains. Un réglage de bout en bout supplémentaire améliore considérablement la précision des prévisions locales.
Les résultats de recherche pertinents sont intitulés « Prévision météorologique de bout en bout basée sur les données » et ont été publiés dans une version non éditée dans Nature.

Adresse du document :
https://www.nature.com/articles/s41586-025-08897-0
Le projet open source « awesome-ai4s » rassemble plus de 100 interprétations d'articles AI4S et fournit également des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s
Ensembles de données : intégration multiplateforme et multi-sources, création de stratégies innovantes de fusion de données
Pour garantir que le système météorologique Aardvark soit totalement indépendant des modèles traditionnels de prévision numérique du temps (PNT) en activité, les chercheurs ont soigneusement construit un ensemble de données d'observation de fusion multi-plateformes et multi-sources.Le système utilise uniquement des données satellite avec des niveaux de traitement de 1B ou 1C.Les données de niveau 1B font référence aux données qui ont été calibrées et géolocalisées, tandis que les données de niveau 1C ont fait l'objet d'une correction de rayonnement et d'un traitement géométrique plus approfondis pour garantir que la précision de l'observation répond aux exigences de déploiement de l'entreprise. Toutes les données couvrent la période allant de 2007 à 2020 et prennent en charge l’acquisition en temps réel, fournissant un flux de données stable pour le système.
Les données d'observation terrestre proviennent de l'ensemble de données HadISD du Bureau météorologique du Royaume-Uni.Contient la température de surface à 8 719 stations, la pression atmosphérique à 8 016 stations, la vitesse du vent à 8 721 stations et la température du point de rosée à 8 617 stations, mises à jour toutes les 6 heures. Les observations océaniques s'appuient sur l'ensemble de données ICOADS de la NOAA des États-Unis, qui intègre des observations en temps réel provenant de navires et de bouées du monde entier. Les données d'observation de la haute atmosphère proviennent des archives IGRA du NCEI, couvrant les profils de température, d'humidité et de vent de 1 375 stations de sondage. L'équipe de recherche a spécialement sélectionné des enregistrements d'observation de la surface et des niveaux de pression clés tels que 200, 500, 700 et 850 hPa.
De plus, les limites géographiques des observations sur le terrain ont incité les chercheurs à introduire des données de télédétection multi-sources. Cette étude a utilisé les données du diffusiomètre ASCAT de la série de satellites MetOp fournies par EUMETSAT en Europe et a construit conjointement un réseau d'observation collaborative micro-ondes-infrarouge avec le système ATOVS (comprenant les instruments AMSUA, AMSUB, MHS et HIRS/4) fourni par NCEI. L'équipe de recherche a également utilisé les données de détection infrarouge hyperspectrale IASI du NCEI pour compléter les informations détaillées sur la distribution verticale de la température et de l'humidité. Pour les observations par satellite géostationnaire, l'équipe de recherche a sélectionné le produit quadrillé GridSat du NCDC, qui élimine l'hétérogénéité temporelle et spatiale des satellites en orbite en standardisant les données des canaux infrarouges et de vapeur d'eau.
Il convient de noter que bien que le système Aardvark fonctionne de manière totalement indépendante du modèle NWP, son architecture modulaire utilise intelligemment l'ensemble de données de réanalyse ERA5 pendant la phase de formation. ERA5, la cinquième génération de réanalyse du Centre européen pour les prévisions météorologiques à moyen terme (ECMWF), est un ensemble de données de réanalyse atmosphérique mondiale de pointe qui fournit une série spatio-temporelle complète de paramètres tels que la température, l'humidité et les champs de vent de 1940 à nos jours. Grâce à cette stratégie innovante de fusion de données, Aardvark Weather non seulement dépasse les limites des modèles numériques traditionnels, mais maximise également les avantages en temps réel et de haute précision des modèles basés sur les données, ouvrant un nouveau paradigme pour la technologie de prévision météorologique mondiale.
Aardvark Weather : nécessite moins de puissance de calcul et augmente la vitesse de prévision par dizaines de fois
Aardvark Weather est un système innovant de prévision météorologique de bout en bout basé sur l'apprentissage profond.Son architecture principale se compose de trois modules : un module codeur, un module de traitement et des modules décodeurs.Le système a été conçu pour éliminer la dépendance aux produits de prévision météorologique numérique traditionnels pendant la phase de déploiement, tout en utilisant pleinement les données de réanalyse historiques de haute qualité pour améliorer les performances du modèle pendant la phase de formation.
L'encodeur est responsable de l'intégration des données d'observation multi-sources, à la fois quadrillées et non quadrillées, pour générer l'état atmosphérique initial. Ce processus utilise une méthode non récursive, qui évite efficacement les problèmes tels que l’instabilité du gradient qui peuvent survenir lors de la mise à jour récursive du filtre de Kalman dans les prévisions météorologiques numériques traditionnelles. Le module de traitement génère une prévision sur 24 heures basée sur l'état initial et l'étend à des délais plus longs à l'aide d'un mécanisme autorégressif. Le décodeur convertit les prévisions quadrillées en prévisions de sites locaux, prend en charge l'extension multitâche et étend encore le champ d'application du système.

En termes d'architecture du modèle, le module d'encodeur et de traitement utilise le transformateur visuel (ViT) comme épine dorsale, et le décodeur utilise un réseau convolutif léger. Cette combinaison garantit à la fois l’efficacité du traitement et la flexibilité du modèle. En termes de stratégie de formation, Aardvark utilise d'abord des données de réanalyse historique haute fidélité (telles que ERA5) pour la pré-formation afin d'apprendre à corriger les biais d'observation, puis optimise chaque module grâce à un réglage fin progressif pour garantir la cohérence entre la formation et le déploiement. Enfin, la précision des prévisions pour des régions et des variables spécifiques peut être encore améliorée grâce à un réglage fin conjoint. Cette méthode de conception et de formation modulaire permet à Aardvark d'être complètement indépendant des modèles numériques traditionnels lors de son déploiement, permettant ainsi de tirer pleinement parti des avantages en temps réel et de haute précision des modèles basés sur les données.
Pour évaluer les performances des prévisions mondiales en grille d’Aardvark Weather, l’équipe de recherche les a comparées à quatre modèles de référence. Les lignes de base les plus simples sont la persistance et le climat horaire, qui sont utilisés pour évaluer si le système de prévision dispose de capacités de base. Une comparaison plus difficile est celle entre les deux systèmes mondiaux de prévision numérique du temps (NWP) déterministes opérationnels les plus largement utilisés : le système de prévision intégré (IFS) du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT) avec HRES haute résolution et le système de prévision mondial (GFS) des Centres nationaux américains pour la prévision environnementale. Les résultats montrent qu'Aardvark est comparable, voire meilleur, que GFS dans la plupart des délais. De plus, pour la plupart des variables, les performances d’Aardvark sont proches de celles de HRES. Bien que l'Aardvark présente des erreurs plus importantes dans la haute atmosphère et à des délais plus courts, ce qui peut être dû aux observations plus concentrées près de la surface, pour des délais plus longs, les prévisions d'Aardvark ont tendance à devenir spectralement floues, ce qui est un phénomène courant dans les systèmes de prévisions météorologiques basés sur les données.
Les résultats de la recherche montrent également qu'Aardvark Weather, en tant que premier système de prévision météorologique entièrement basé sur les données de bout en bout, apprend la cartographie directe des données d'observation brutes vers les résultats de prévision. Il est totalement indépendant des produits NWP lors de son déploiement et s'appuie uniquement sur des données d'observation pour générer des prévisions. La vitesse de génération est plusieurs ordres de grandeur plus rapide que celle des systèmes existants. Le système météorologique Aardvark ne prend qu'environ une seconde sur quatre GPU NVIDIA A100 pour générer une prévision complète à partir de données d'observation. En comparaison, le système conventionnel à haute résolution (HRES) du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT) nécessite environ 1 000 heures de nœuds uniquement pour effectuer l'assimilation et la prévision des données. Même si la quantité de données d'observation utilisées est d'un ordre de grandeur inférieur à la base de référence de l'entreprise et que les besoins en ressources informatiques sont de plusieurs ordres de grandeur inférieurs à ceux des méthodes traditionnelles,Aardvark produit toujours des prévisions sur une grille mondiale de 1,5 degré et surpasse les systèmes NWP opérationnels en termes d'erreur quadratique moyenne (RMSE) sur plusieurs variables et délais.

L’IA a été largement utilisée dans le domaine des prévisions météorologiques numériques
À l’heure actuelle, la science météorologique mondiale connaît un changement de paradigme mené par la technologie de l’intelligence artificielle, et les capacités de recherche scientifique de mon pays ont démontré une forte dynamique de percée dans cette révolution technologique. S'appuyant sur l'innovation itérative des algorithmes d'apprentissage profond,Les institutions de recherche nationales ont construit un système de modèle intelligent couvrant l’ensemble de la chaîne de prévision météorologique.Cela a non seulement considérablement amélioré la précision et l’efficacité des prévisions, mais a également favorisé l’intégration profonde de la météorologie et de l’IA.
Par exemple, en tant que premier modèle de réseau neuronal tridimensionnel au monde adapté au système de coordonnées terrestres, le modèle météorologique Pangu de Huawei rompt avec la dépendance traditionnelle des prévisions numériques aux équations physiques. Sa stratégie innovante d'agrégation hiérarchique du domaine temporel supprime efficacement l'accumulation d'erreurs itératives, permettant à la résolution des prévisions météorologiques mondiales à moyen terme d'atteindre un niveau record de 0,25° dans l'industrie. Le modèle météorologique Fuxi de l'Université Fudan adopte une approche différente, permettant une prédiction collaborative des éléments météorologiques grâce à un cadre d'apprentissage multitâche. Sa conception de fonction de perte pondérée en fonction de la latitude résout intelligemment le problème de l'industrie lié à la précision de prédiction atténuée dans les régions à haute latitude, en particulier en obtenant des améliorations significatives de la précision de prédiction des événements de précipitations de petite à moyenne ampleur.
Dans le domaine des prévisions spéciales, le système « Fengwu » du Laboratoire d'intelligence artificielle de Shanghai utilise la technologie de fusion multimodale pour compresser l'erreur de prévision de 120 heures de la trajectoire du typhon à une précision révolutionnaire de 121,4 kilomètres, ce qui représente un bond en avant par rapport à l'erreur de 293,8 kilomètres du Centre européen pour les prévisions météorologiques à moyen terme (ECMWF). Le modèle de prévision océanique « Ask the Sea » du laboratoire Laoshan a intégré de manière innovante les principes de la dynamique océanique dans l'architecture du réseau neuronal, créant ainsi le premier système intelligent de prévision de l'environnement océanique au monde avec une résolution de 1/12°.
Non seulement cela, Le « Programme de démonstration du modèle de prévision météorologique IA » mené par l'Administration météorologique chinoise accélère la transformation des réalisations technologiques. Les systèmes Fengqing, Fenglei et Fengshun ont été publiés.Il marque la transformation de la technologie de l’IA de la recherche à l’application. Parmi eux, le système « Vent et Tonnerre » a été le pionnier d’une architecture hybride de guidage physique et de données. Cette voie technique de « fusion mathématique » compense efficacement les lacunes des modèles d’IA pure dans l’interprétabilité des événements météorologiques extrêmes.Le grand modèle « Fengqing » génère une prévision mondiale sur 15 jours à une vitesse étonnante de 3 minutes, prolongeant le temps de prévision effectif des éléments de base à 10,5 jours.Le système de prévision sous-saisonnière « Fengshun » en cours de construction marque le début de l'extension de la technologie de l'IA dans le domaine plus difficile des prévisions climatiques.
Bien que la recherche sur les grands modèles météorologiques d’IA nationaux soit passée de la vérification technique aux applications commerciales, ses avantages en termes d’efficacité élevée et de faible coût ont apporté un nouveau paradigme pour les prévisions météorologiques mondiales. Cependant, l’interprétabilité des mécanismes physiques, la nature en temps réel des données et la modélisation des événements extrêmes restent des problèmes difficiles qui doivent être surmontés. Avec l’approfondissement continu du cadre de fusion de données physiques et le renforcement de la coopération interdisciplinaire,La technologie de l’IA devrait propulser les prévisions météorologiques vers une nouvelle ère de plus grande précision et d’application plus large, des prévisions à court terme à l’échelle de la minute aux prévisions climatiques à l’échelle saisonnière.