HyperAI

L'Université D'état Du Colorado Publie Le Modèle CSU-MLP Pour Prédire Les Conditions Météorologiques Extrêmes À Moyen Terme À L'aide De L'algorithme De Forêt Aléatoire

特色图像

Les prévisions météorologiques, en particulier les prévisions météorologiques extrêmes, ont un impact important sur le travail et la vie quotidienne des gens. Le rapport de recherche Sigma « Catastrophes naturelles en période d’accumulation économique et de changement climatique » montre que les pertes mondiales causées par les phénomènes météorologiques violents ont continué d’augmenter ces dernières années. Rien qu'en 2019,Les pertes économiques mondiales causées par les catastrophes connexes se sont élevées à 146 milliards de dollars américains, et les pertes d’assurance à 60 milliards de dollars américains.Le rapport indique également qu’à mesure que les catastrophes météorologiques graves deviennent de plus en plus destructrices, les pertes qui en découlent seront encore plus aggravées à l’avenir. Il est donc particulièrement urgent de prévoir avec précision les phénomènes météorologiques violents.

Récemment, Aaron J. Hill et Russ S. Schumacher de l'Université d'État du Colorado et Israel Jirak du Storm Prediction Center (SPC) de la National Oceanic and Atmospheric Administration (NOAA) ont développé conjointement un modèle d'apprentissage automatique basé sur des forêts aléatoires, CSU-MLP.Le modèle est capable de prévoir avec précision les phénomènes météorologiques violents à moyen terme (4 à 8 jours).Les résultats ont été publiés dans la revue Weather and Forecasting.

Les résultats ont été publiés dans Weather and Forecasting.

Adresse du document :

https://arxiv.org/abs/2208.02383

 Présentation du CSU-MLP

Les prévisions météorologiques extrêmes aux États-Unis sont généralement établies par le SPC mentionné ci-dessus à l'aide du modèle de prévision numérique du temps (NWP), qui peut avertir de conditions météorologiques extrêmes spécifiques et du lieu de leur apparition 1 à 2 jours à l'avance.Cependant, 3 à 8 jours à l'avance, nous pouvons seulement avertir de l'endroit où le temps se produira, mais nous ne pouvons pas prédire quel type de temps violent il s'agira.

Au cours de la dernière décennie, un modèle de prévision numérique du temps à haute résolution CAMs (modèles permettant la convection) a émergé. Les prévisions dans un intervalle de temps inférieur à 4 jours (court terme) sont devenues plus précises, mais pour les intervalles de temps à moyen et long terme, l’effet de prédiction ne s’est pas amélioré de manière significative. Dans ce contexte,L’apprentissage automatique est progressivement appliqué dans le domaine de la météorologie.

Dans cette étude CSU-MLP (Colorado State University Machine Learning Probabilities), les données météorologiques pour la formation du modèle proviennent de l'ensemble de données de prévision du Global Ensemble Forecast System version 12 (GEFSv12) (ci-après dénommé GEFS/R), qui contient 20 ans de données météorologiques historiques détaillées pour les États-Unis continentaux.Les chercheurs ont sélectionné neuf années de données (2003-2012) comme ensemble d’entraînement pour cette étude de prévision à moyen terme.Deux années (2020-2022) ont été sélectionnées comme ensemble de tests.

 Algorithme de forêt aléatoire 

Cette étude est basée sur un algorithme d’apprentissage automatique appelé Random Forest (RF).La forêt aléatoire est un algorithme de classification et de régression basé sur l'apprentissage d'ensemble.Plus précisément, dans cette étude, les caractéristiques des conditions météorologiques extrêmes sont saisies et l’arbre de décision entier est parcouru pour obtenir les résultats de prévision des conditions météorologiques extrêmes.

Par conséquent, la saisie des caractéristiques du mauvais temps est particulièrement importante dans l’algorithme de la forêt aléatoire.Les chercheurs ont extrait 12 variables caractéristiques liées aux conditions météorologiques extrêmes de l’ensemble de formation mentionné ci-dessus pour la formation.Les variables caractéristiques spécifiques sont présentées dans le tableau suivant.

12 variables de caractéristiques pour l'entraînement et la prédiction du modèle

Cependant, dans l’ensemble de données GEFS/R, la résolution de ces variables caractéristiques n’est pas cohérente, les chercheurs ont donc effectué un traitement d’interpolation.Il a été unifié à un espacement de grille de 0,5 degré (espacement de grille dergee).

 Ingénierie des fonctionnalités 

En plus d’utiliser des forêts aléatoires pour les capacités d’analyse des prévisions météorologiques extrêmes à moyen terme, l’ingénierie des fonctionnalités a été brièvement explorée dans cette étude. L'ingénierie des fonctionnalités fait référence à une technique de traitement de données utilisée pour collecter des fonctionnalités autour d'événements observés et les convertir sous une forme pouvant être utilisée par des algorithmes d'apprentissage automatique. Plus précisément, dans cette expérience, les chercheurs ont principalement proposé deux méthodes pour simplifier les fonctionnalités.Y compris la moyenne spatiale des caractéristiques et le décalage temporel.

La moyenne spatiale fait référence au fait que les chercheurs prennent la valeur moyenne de toutes les variables caractéristiques à chaque point de l'espace de prédiction.doncL’interférence des données bruyantes peut être réduite pour améliorer les performances du modèle.Le processus spécifique est illustré dans la figure ci-dessous.

Méthode de traitement de combinaison de variables de caractéristiques

La méthode du décalage temporel fait référence au processus de prévision ou de modélisation.L’application différée d’observations d’une période donnée dans le passé aux prévisions ou à la modélisation au moment actuel.

Elle repose sur l’hypothèse selon laquelle les données d’observation passées peuvent fournir des informations utiles sur l’état actuel et les tendances futures.Dans cette expérience, les chercheurs ont utilisé une méthode de décalage temporel pour étendre la taille de l’ensemble de données GEFS/R.Mais ce processus ne génère aucun effort de calcul supplémentaire pour le modèle.

 Résultats des tests

Les chercheurs ont testé les prévisions du CSU-MLP en utilisant 1,5 an de prévisions météorologiques en temps réel de GEFSv12 et les ont comparées aux prévisions manuelles générées par SPC. Les résultats des tests pertinents montrent queDans la plage de prévision à moyen terme, la précision et la zone de prévision du système de prévision basé sur la forêt aléatoire sont meilleures que celles du SPC.Comme le montre la figure ci-dessous. Cependant, à mesure que la période de temps augmente, les capacités de prévision des deux diminuent.

Comparaison des prévisions à moyen terme du CSU-MLP et du SPC au 27 mars 2022

La figure a est la prévision sur 4 jours de CSU-MLP et la figure b est la prévision sur 4 jours de SPC. dans,La zone ombrée représente la probabilité prévue de phénomènes météorologiques violents.Les icônes circulaires font référence aux prévisions locales du SPC pour les tornades (rouge), la grêle (vert) et les tempêtes (bleu), et les coins inférieurs gauche et droit de l'image sont le score de compétence de prévision BSS pour évaluer la précision des prévisions météorologiques et la couverture d'observation pour évaluer la représentativité des prévisions météorologiques locales, respectivement.

À cet égard, les chercheurs ont conclu que la compétence et la précision de l’ensemble du système de prédiction ont été considérablement améliorées.Cela est principalement dû au fait que le système de prédiction basé sur les forêts aléatoires possède de fortes capacités de prédiction à la fois dans les contours à probabilité continue et à faible probabilité (les contours formés par des zones à faible probabilité dans l’estimation des phénomènes météorologiques violents)..

En outre, les chercheurs ont également testé l’impact de différentes régions et de différents facteurs (thermodynamique et cinétique) sur les prévisions.Les variables caractéristiques sont étudiées comme étant importantes pour la prévision des phénomènes météorologiques violents.Le résultat est montré dans la figure ci-dessous.

Différentes variables caractéristiques sont importantes pour les prévisions météorologiques

Bien que les impacts spécifiques des facteurs et des régions mentionnés ci-dessus sur les prévisions doivent encore être étudiés plus en détail, les chercheurs ont émis un jugement préliminaire : ces différentes variables caractéristiques seront davantage apprises par le modèle et utilisées pour les prévisions météorologiques extrêmes. Cela montre également queLe système de prédiction basé sur la forêt aléatoire a été davantage formé et amélioré, et présente une certaine crédibilité et praticité.

Bien entendu, au cours de cette expérience, les chercheurs ont également souligné qu’il reste encore de nombreux aspects à améliorer dans le système de prédiction basé sur les forêts aléatoires. Par exemple,Le CSU-MLP doit également ajouter les données de prévision des prévisions manuelles du SPC.Améliorer davantage la crédibilité des résultats de prévision de l’apprentissage automatique.

 Une nouvelle étape de la météorologie intelligente basée sur l’IA pourrait arriver

Les humains se sont toujours efforcés de comprendre et de prédire le monde, et l’un des exemples les plus réussis est la prévision météorologique. Dans l'Antiquité, les gens faisaient principalement des prévisions basées sur leur expérience de vie, comme par exemple : « S'il y a une lueur matinale, ne sortez pas, mais s'il y a une lueur du soir, vous pouvez voyager des milliers de kilomètres. » À l'époque moderne,Les scientifiques commencent à utiliser des capteurs et des satellites météorologiques pour collecter de grandes quantités de données afin de faire des prévisions plus précises.

Il convient de noter qu’au stade actuel du développement de la météorologie, l’ajout de l’IA a considérablement amélioré la précision des prévisions météorologiques. Selon les médias étrangers,Ces dernières années, les chercheurs météorologiques suisses ont réussi à prédire l’heure et le lieu des éclairs grâce à l’introduction de l’IA.Le modèle a actuellement une précision de prédiction de 80%.

Parallèlement, dès 2015, IBM a dépensé 2 milliards de dollars pour acquérir les actifs numériques et de données de Weather Co., la société mère de Weather Channel. La raison pour laquelle l'entreprise a dépensé une somme aussi importante était qu'elle prévoyait de combiner les données météorologiques et les informations de prévision de Weather Co. avec son service d'IA Watson. visible,Des géants comme IBM sont très optimistes quant au potentiel de l’IA en météorologie et ont commencé à élaborer des plans.

Ce n’est pas difficile à prévoir. Bien qu’il existe des milliers de facteurs objectifs qui influencent les changements météorologiques, il est toujours difficile de prévoir le temps avec précision.Mais à mesure que l’intégration de l’IA et de la météorologie s’approfondit, une nouvelle ère de météorologie intelligente définie par l’IA pourrait arriver plus rapidement.

PS:

Le code et l'ensemble de données de cet article seront publiés sur le site officiel d'HyperAI, Hyper.ai. Les partenaires intéressés peuvent continuer à y prêter attention~