En Résolvant Les Problèmes De Silos De Données, De Consommation De Calcul Et D'accumulation D'erreurs, Su Rui Du Laboratoire D'intelligence Artificielle De Shanghai : FengWu-GHR Réalise De Multiples Avancées Dans Les Prévisions Météorologiques Par IA

« Avant l’émergence des méthodes d’IA, il fallait 10 ans pour améliorer les compétences en matière de prévision météorologique d’un jour, mais après l’introduction de l’IA, les compétences en matière de prévision peuvent être améliorées en quelques mois. »
Lors du forum « IA pour la science » de la conférence Zhiyuan de Pékin 2024, Su Rui, un jeune chercheur du laboratoire d'intelligence artificielle de Shanghai, a passé en revue le développement historique des prévisions météorologiques de l'IA, a discuté en profondeur des défis rencontrés dans ce domaine et a présenté de manière exhaustive les résultats de recherche de son équipe FengWu-GHR.

HyperAI a compilé et résumé le partage approfondi du professeur Su Rui sans violer l'intention initiale. Décryptons les dernières avancées en météorologie IA !
aujourd'hui,Le sujet que je vais partager avec vous est « Explorer l'avenir, contrôler intelligemment la météo - Progrès frontaliers de l'intelligence artificielle dans la recherche en sciences de la Terre ».
La recherche dite en sciences de la Terre se réfère principalement à l’étude de l’atmosphère, de l’océanosphère, de la biosphère, de la lithosphère et des interactions, des échanges et des processus de circulation entre eux. En fait, la circulation de l'atmosphère et de l'océan aura un impact important sur la météorologie, le climat, l'écosystème, etc. de la Terre. Simuler et analyser les changements dans l'atmosphère et l'océan, puis prédire le temps et le climat, etc., sont essentiels au développement durable de l'humanité.
Prévisions IA vs prévisions numériques
Par le passé, de grands progrès ont été réalisés dans la recherche de modèles de prévision numérique basés sur la physique, mais leur développement est encore lent et la demande en puissance de calcul est très importante. Avec l’application réussie de l’apprentissage profond et de l’intelligence artificielle dans divers domaines, de plus en plus d’institutions de recherche ont commencé à essayer d’utiliser des méthodes basées sur les données pour les prévisions météorologiques.

Par exemple,Le Centre européen pour les prévisions météorologiques à moyen terme est une autorité reconnue au niveau international.Depuis 2018, nous avons pris l’initiative d’essayer d’utiliser la technologie d’apprentissage profond pour les prévisions météorologiques, mais en raison des données météorologiques à faible résolution de l’époque, l’effet de cette tentative a été médiocre.
Février 2022NVIDIA lance le modèle météo FourCastNetPour la première fois, des prévisions ont été réalisées sur la base de données météorologiques à haute résolution de 0,25°, mais le modèle n'a toujours pas dépassé le modèle de prévision numérique physique utilisé par le Centre européen pour les prévisions météorologiques à moyen terme, et ce modèle ne peut prédire qu'un petit nombre d'éléments météorologiques.
Novembre 2022Huawei lance le modèle météorologique PanguL'annonce selon laquelle le modèle a surpassé le modèle IFS du Centre européen pour les prévisions météorologiques à moyen terme sur les données météorologiques à haute résolution a été considérée comme une avancée majeure.
Un mois plus tard,Deepmind La société a lancé le modèle météorologique GraphCast.La principale caractéristique de ce modèle est qu’il peut prédire davantage d’éléments météorologiques différents.
Avril 2023Notre équipe (Shanghai Artificial Intelligence Laboratory) a lancé son propre modèle météorologique à grande échelle FengWu,Par rapport à tous les modèles précédents, FengWu a réalisé des améliorations significatives en termes de performances.
Le modèle FengWu piloté par l'IA atteint une capacité optimale de prédiction de la trajectoire des typhons
Rolling Forecast, l'inspiration du modèle FengWu
Si nous déplions la Terre en un plan et quadrillons le plan, nous diviserons la longitude et la latitude du globe en une résolution spatiale de 0,25° (équivalente à une échelle d'environ 25 kilomètres). Cela signifie que le globe est divisé en environ 720 × 1 440 points de grille, chacun étant divisé en 37 niveaux différents en hauteur verticale, impliquant 169 variables telles que la température, l'humidité, la vitesse du vent, la température de surface de la mer et la vitesse du vent de surface. Les prévisions météorologiques consistent à prédire les changements futurs dans le champ des éléments météorologiques mondiaux en fonction du champ des éléments météorologiques mondiaux.

Après avoir analysé les données horaires du champ d'éléments météorologiques mondiaux au cours des 40 dernières années, notre équipe a découvert que le champ d'éléments météorologiques mondiaux à chaque instant est en fait une annotation naturelle du champ d'éléments à l'instant précédent. Par conséquent, sans avoir besoin de données étiquetées supplémentaires, nous devons seulement prédire la relation entre les champs d’éléments météorologiques à deux moments adjacents pour prédire les changements futurs dans les champs d’éléments météorologiques.C'est l'inspiration originale du modèle FengWu.
Plus précisément, après que le modèle FengWu a prédit le champ d'éléments météorologiques au moment suivant, il l'utilise comme entrée pour prédire le champ d'éléments météorologiques au moment suivant, et ainsi de suite.Une telle prévision continue peut produire le champ d’éléments météorologiques à prévoir pour les 14 prochains jours.
Deux avantages majeurs : des compétences en prévision à long terme + une grande efficacité de calcul
Le modèle FengWu présente deux avantages majeurs.Il faut avoir des compétences en matière de prévision à long terme,Une capacité de prévision de 10,75 jours peut être atteinte. En fait, avant l’émergence des méthodes d’IA, le modèle de prévision numérique basé sur la physique pouvait améliorer la capacité de prévision d’un jour tous les 10 ans en moyenne. Après l’introduction de l’IA, la capacité de prévision pourrait être améliorée en quelques mois seulement.

Un autre avantage du modèle FengWu est l’efficacité de calcul.Par le passé, le modèle de prévision numérique basé sur la physique nécessitait l’exécution de 10 000 nœuds de calcul pendant une heure pour générer des résultats de prévision pour les 10 jours suivants. Le modèle FengWu n'a besoin que d'un seul GPU pour fonctionner pendant 30 secondes pour compléter les résultats de prévision dans le même temps, ce qui est plus de 2 000 fois plus rapide que les méthodes traditionnelles.
Sentiments mitigés : les forces et les défis de FengWu dans la prévision des typhons
Afin d'évaluer la capacité du modèle FengWu à prédire la trajectoire des typhons, notre équipe l'a testé en utilisant des données sur les typhons après 2023 et a comparé les résultats des tests avec ceux du Centre européen pour les prévisions météorologiques à moyen terme, de l'Agence météorologique japonaise, du Bureau météorologique américain et d'autres institutions.

Les résultats montrent que lorsque la trajectoire du typhon est prévue de 0 à 120 heures à l’avance,Le modèle FengWu présente la plus petite erreur dans la prédiction des positions des typhons à chaque nœud.
Par rapport aux méthodes physiques traditionnelles,Il existe encore une lacune dans la capacité de l’IA à prédire l’intensité des typhons.Cela est dû au fait que tous les modèles actuels basés sur l’IA sont formés de manière axée sur les données. Étant donné qu’il existe relativement peu de données sur les événements météorologiques extrêmes tels que les typhons, les modèles d’IA ont tendance à lisser les résultats lors de la prévision des conditions météorologiques extrêmes, ce qui entraîne de faibles performances dans les prévisions d’intensité des typhons.
FengWu-GHR : Pour la première fois, la résolution des prévisions de l'IA a été augmentée à 0,09°
Problèmes urgents à résoudre : haute résolution et accumulation d'erreurs à long terme
En fait, après avoir terminé le développement du modèle FengWu, nous avons reçu des commentaires de nombreux experts du domaine météorologique. L’un des retours est que, bien que FengWu ait pu obtenir une prédiction à haute résolution de 0,25°,Mais ils espèrent toujours obtenir des prévisions météorologiques à plus haute résolution.Un autre retour d'information est,Le problème de l’accumulation d’erreurs causée par les prévisions à long terme doit être davantage résolu.

Pourquoi avons-nous besoin de prévisions météorologiques plus précises et à plus haute résolution ?
En prenant comme exemple le graphique de la température de surface de Shanghai, nous pouvons voir que même si Shanghai n'est pas grande, les différences de température entre les différentes zones sont évidentes. Lorsque la distance nord-sud n'est que de 80 kilomètres, si nous utilisons le modèle de prévision météorologique de 0,25° pour la prédiction, nous ne pouvons obtenir qu'environ 3 points de grille de données, ce qui n'est pas suffisant pour décrire les détails de la distribution météorologique. Des données de prévision à plus haute résolution peuvent fournir une simulation plus précise du mouvement atmosphérique, conduisant à des résultats de prévision plus précis.

Pour résoudre ce problème, nous avons lancé le modèle FengWu-GHR, qui est le premier modèle de prévision météorologique IA implémenté à une haute résolution de 0,09°. Son processus de mise en œuvre spécifique n’est pas simple.
Premièrement, augmenter la résolution de 0,25° à 0,09° augmentera l’effort de calcul et la consommation de mémoire de plus de 80 fois. Deuxièmement, les données d’analyse météorologique à haute résolution sont extrêmement rares, mais les modèles d’IA nécessitent une grande quantité de données pour la formation, ce qui rend extrêmement difficile la formation d’un modèle météorologique d’IA à haute résolution à partir de zéro.

Pour résoudre ces problèmes, nous tentons de décomposer le mouvement atmosphérique à haute résolution en deux composants différents.
Tout d’abord, un modèle (méta-modèle) est formé à l’aide d’une grande quantité de données à basse résolution. Ensuite, les données météorologiques à haute résolution sont décomposées en plusieurs données météorologiques à basse résolution, et le méta-modèle est utilisé pour prédire chaque donnée météorologique. Enfin, ces résultats de prévision sont assemblés pour obtenir des résultats de prévision météorologique à haute résolution.
Cependant, une telle approche n’exploite pas pleinement les relations non linéaires dans les données à haute résolution. C'est pourquoi, sur cette base, nous avons introduit un nouveau module et un petit nombre de paramètres, et avons formé le module à l'aide de données à haute résolution pour lui permettre de mieux capturer la relation de couplage non linéaire entre les régions à haute résolution.

Plus précisément, l'icône sur le côté gauche de la figure ci-dessus est le champ haute résolution d'origine, qui est divisé en 4 champs basse résolution différents, puis prédit par le modèle de langage. Après la combinaison, la prédiction du champ haute résolution est obtenue, et enfin le module nouvellement ajouté est utilisé pour capturer sa non-linéarité.

Lorsqu’on traite du problème des erreurs cumulatives dans les prévisions à long terme,Pangu utilise un modèle de formation distinct à chaque instant de prédiction pour résoudre ce problème. C’est une méthode efficace, mais son coût de formation est très élevé. Nous avons donc ajouté un module LoRA à chaque étape du processus de prédiction et formé chaque étape avec un petit nombre de paramètres. Cela équivaut à avoir un nouveau modèle pour chaque étape de prédiction, mais ne nécessitant qu'un petit nombre de paramètres, ce qui réduit considérablement le coût de calcul.
Évaluation du modèle : FengWu-GHR améliore encore ses prévisions météorologiques
Étant donné que seul l'IFS a obtenu un résultat de résolution de 0,09°, nous l'utilisons comme norme de référence pour vérifier nos résultats de test.

Les résultats montrent que FengWu-GHR présente des avantages évidents dans les indicateurs RMSE et ACC, avec un RMSE plus faible et un ACC plus élevé.

L'indicateur Bias est utilisé pour mesurer l'écart des résultats de prédiction. Plus FengWu-GHR est proche de 0, meilleurs sont les résultats du test. Utilisez les mesures d’activité pour déterminer si les résultats de prédiction deviennent plus ambigus à mesure que le temps de prédiction augmente. Les résultats montrent que les résultats de prédiction de FengWu-GHR ont progressivement tendance à être lisses, et le modèle ne résout toujours pas l'effet de lissage sur les prévisions météorologiques extrêmes.

En analysant les données de terrain et les données d'observation en temps réel de 18 000 stations météorologiques différentes, nous utilisons les données de juillet à décembre 2022 pour tester le modèle et le comparer avec les modèles IFS_HRES et Pangu.FengWu-GHR présente l’avantage de pouvoir prévoir les résultats obtenus un certain nombre de jours à l’avance.


De plus, FengWu-GHR présente également des avantages dans la prévision des vagues de chaleur et des vagues de froid.
Aujourd’hui, nous parlons de la question des prévisions météorologiques à moyen terme. En fait, il existe de nombreuses échelles différentes de prévisions dans le domaine atmosphérique, notamment des prévisions climatiques saisonnières à 1 à 3 jours, à long terme, etc. À l'heure actuelle, nous nous concentrons principalement sur la recherche de capacités de prévision météorologique à moyen terme, mais à l'avenir, nous espérons mener des recherches approfondies pour déterminer si nous pouvons passer des prévisions à moyen terme aux prévisions au niveau climatique, et étudier plus en détail l'évolution du climat et les tendances futures du développement.