HyperAIHyperAI

Précision Améliorée De 400% ! Le Modèle Indien De Prévision De La Mousson, Basé Sur 36 Stations Météorologiques, Permet Des Prévisions Détaillées À l'échelle De La ville.

特色图像

Mumbai, en Inde, entre chaque année en mousson de juin à septembre. Les épisodes pluviométriques extrêmes sont devenus fréquents ces dernières années, avec une augmentation moyenne de près de 401 tonnes TP3 par rapport aux niveaux d'avant 2019. Cette ville côtière de 18 millions d'habitants est souvent plongée dans le chaos par de fortes pluies : les alertes météorologiques tardives entraînent souvent des suspensions d'activités scolaires et professionnelles, voire de graves inondations. Les catastrophes dévastatrices de la mousson rendent urgentes des prévisions météorologiques localisées plus précises.

Cependant, dans les climats tropicaux de mousson, la résolution des modèles météorologiques mondiaux standard, d'environ 25 kilomètres carrés, rend difficile la prise en compte des subtiles différences entre les systèmes météorologiques locaux. La complexité du terrain accentue également l'incertitude spatiale des inondations. Par conséquent, les prévisions de mousson se limitaient jusqu'à présent aux macro-tendances.

Pour combler les lacunes dans la prévision des risques d’inondation urbaine, l’Indian Institute of Technology de Bombay et l’équipe de recherche de l’Université du Maryland ont collaboré pour développer un modèle de prévision hyperlocal basé sur des réseaux neuronaux convolutifs (CNN) et l’apprentissage par transfert (CNN-TL), capable de prédire la plupart des événements de fortes pluies plusieurs jours à l’avance.Selon le dernier rapport de Science, Mumbai envisage désormais de l'intégrer à son système officiel d'alerte précoce, marquant une nouvelle étape dans la prévision hyperlocale des inondations dans les villes d'Asie du Sud.

Les résultats de recherche associés sont prépubliés sur SSRN sous le titre « Prévisions de précipitations extrêmes hyperlocales à Mumbai : approche de réduction d'échelle basée sur l'apprentissage par transfert de réseau neuronal convolutionnel ».

Points saillants de la recherche :

* Réaliser des prévisions hyperlocales à l’échelle de la ville, en réduisant la résolution au niveau de la zone urbaine, en comblant les lacunes de la prévision des risques d’inondation dans les modèles numériques traditionnels (grille de 25 km) ;

* En utilisant une combinaison de réseaux neuronaux convolutifs et d'apprentissage par transfert, le modèle est formé sur la base de données de précipitations complètes et affiné à l'aide d'échantillons de précipitations extrêmes, améliorant ainsi efficacement la capacité du modèle à capturer des événements extrêmes.

* Le modèle de synchronisation spatiale des précipitations extrêmes à Mumbai a été révélé par la méthode de synchronisation des événements et l'algorithme de Louvain, qui est plus efficace que les méthodes de clustering traditionnelles.

Adresse du document :
https://go.hyper.ai/j05Vt

Suivez le compte officiel et répondez « Prévisions de mousson en Inde » pour obtenir le PDF complet

Autres articles sur les frontières de l'IA : 

https://hyper.ai/papers

« Données du modèle + données de prévision », examen de 36 stations d'observation en fonction des lacunes de données

Les ensembles de données utilisés dans cette étude sont divisés en deux catégories : les données du modèle et les données mesurées :

  • Données du mode :Le Global Forecast System (GFS) des Centres nationaux pour la prévision environnementale des États-Unis (NCEP) couvre la période de juin 2015 à septembre 2023, avec une portée spatiale de 18°–20°N et 72°–74°E, et une résolution de 0,25°×0,25° ;
  • Données de prévision :Les données proviennent des stations météorologiques automatiques (AWS) déployées par la municipalité de Mumbai (MCGM), avec une fréquence d'enregistrement de 15 minutes, couvrant la période de 2006 à 2023 (hors 2014). En raison de mesures manquantes et de données discontinues à certaines stations, seules 36 stations d'observation disposant de données relativement complètes pour la saison de la mousson 2015-2023 (juin à septembre) ont été sélectionnées pour l'analyse.

Afin de garantir la qualité des données d’entrée et d’améliorer les performances prédictives du modèle, l’équipe de recherche a traité les données en éliminant les données manquantes, en filtrant les variables et en effectuant une correspondance spatiale.Pour les données d'observation brutes des stations météorologiques automatiques, l'équipe de recherche a éliminé les sites présentant des lacunes importantes en matière de données, ne conservant que ceux dont les enregistrements étaient complets pendant au moins cinq années consécutives durant la mousson (juin-septembre). De plus, les chercheurs ont utilisé un criblage de corrélation au sein des données du modèle pour sélectionner comme variables prédictives les facteurs météorologiques fortement corrélés aux précipitations (tels que l'eau précipitable, les précipitations, l'humidité relative, la température et la pression atmosphérique).

Après le prétraitement, l'équipe de recherche a aligné les données de la grille GFS avec les données d'observation du site pour construire des paires « entrée-sortie » comme échantillons d'entraînement pour les réseaux neuronaux convolutifs et les modèles d'apprentissage par transfert.

Prévision des précipitations basée sur un réseau neuronal convolutif et un apprentissage par transfert

Le modèle utilise les données GFS en entrée et les combine avec les précipitations mesurées. Il utilise d'abord un réseau neuronal convolutif pour abaisser la prévision à faible résolution à l'échelle du site, puis l'apprentissage par transfert pour optimiser les prévisions de précipitations extrêmes. Enfin, il combine les comparaisons de sites pour identifier la synchronicité régionale des orages et améliorer la précision globale des prévisions.

Organigramme du modèle de prévision des précipitations extrêmes

Clustering de Louvain basé sur la méthode de synchronisation des événements

Cette étude a introduit la méthode de synchronisation des événements pour identifier les tempêtes de pluie régionales en comparant les séries chronologiques de précipitations à différentes stations, révélant le modèle de synchronisation spatiale des précipitations extrêmes dans les villes.Par rapport à l’analyse de corrélation linéaire traditionnelle, cette méthode est plus adaptée à la capture de conditions de précipitations extrêmes avec une forte soudaineté et des caractéristiques non linéaires évidentes.

Après avoir saisi les données prétraitées, l'équipe de recherche a utilisé une analyse de corrélation pour sélectionner les variables GFS les plus étroitement liées aux précipitations. Elle a considéré les précipitations extrêmes à chaque station pendant la période d'observation comme des « événements » et a évalué leur synchronisation dans la série chronologique en calculant la différence de temps et la fréquence des événements entre les stations.

Après avoir généré la matrice de synchronisation des événements entre les stations, les chercheurs ont ensuite utilisé l'algorithme de Louvain pour regrouper les relations et diviser les stations avec des caractéristiques de synchronisation des précipitations similaires dans le même groupe.

Réduction d'échelle des modèles de réseaux neuronaux convolutifs

Après avoir terminé le clustering,Sur la base du modèle de réseau neuronal convolutif, l’équipe de recherche a progressivement réduit les données GFS à basse résolution à l’échelle du site.

Les chercheurs ont d’abord examiné les variables météorologiques quadrillées du GFS, en conservant les facteurs les plus étroitement liés aux précipitations, tels que le taux de précipitations, l’humidité, la température et la pression atmosphérique.Et entrée dans le modèle de réseau neuronal convolutif sous forme quadridimensionnelle.

Le réseau neuronal convolutionnel utilisé dans cette étude est divisé en couches convolutionnelles et couches d'aplatissement. Les couches convolutionnelles extraient les caractéristiques spatiales et temporelles des variables d'entrée, tandis que les couches d'aplatissement alignent ensuite ces caractéristiques avec les données pluviométriques mesurées à la station météorologique automatique de Mumbai, établissant ainsi une relation entrée-sortie. Les caractéristiques locales capturées et extraites par le réseau neuronal convolutionnel sont ensuite générées pour prédire directement les précipitations quotidiennes à chaque station, réalisant une conversion descendante non linéaire des données GFS à faible résolution vers des données pluviométriques à granularité fine à l'échelle de la station.

Il convient de mentionner queLes chercheurs ont également introduit des mesures telles que l’arrêt précoce pour éviter le surapprentissage.

Architecture du modèle de réseau neuronal convolutif

Apprentissage par transfert, réglage fin et optimisation

Dans cette étude,L'équipe a introduit des méthodes d'apprentissage par transfert pour permettre au modèle de reconnaître les caractéristiques des conditions générales de précipitations et des événements de précipitations extrêmes :Parmi elles, la couche convolutionnelle de base reste inchangée, tandis que la partie proche de la couche de sortie permet des mises à jour de paramètres pour éviter les problèmes de coût de calcul élevé et d'échantillons insuffisants, tout en empêchant le modèle de sur-ajuster sur des échantillons extrêmes.

L'équipe de recherche a d'abord entraîné le modèle de base du réseau neuronal convolutif à partir des données pluviométriques complètes de la station d'observation de Mumbai de 2015 à 2023 afin de garantir la stabilité du modèle en matière de prédiction des précipitations générales de moyenne et faible intensité. De plus, lors de la phase de réglage fin, les chercheurs ont utilisé des échantillons de précipitations de forte intensité dépassant les quantiles 95% ou 99%.Faites en sorte que le modèle « se concentre sur l’apprentissage » des événements extrêmes et améliorez sa sensibilité aux échantillons extrêmes.

Vérification des performances du modèle dans le temps et dans l'espace

L'équipe de recherche a utilisé divers indicateurs statistiques et des cas réels pour vérifier les performances du modèle. Les résultats ont montré que le modèle de prévision surpassait largement le système de prévision global (GFS) traditionnel et les modèles de réseaux neuronaux convolutifs non optimisés sur de nombreux aspects.L'évaluation utilise des indicateurs quantitatifs courants, notamment le coefficient de corrélation (CC), l'erreur quadratique moyenne (RMSE), le taux de fausses alarmes (FA), etc.

Performances globales des prévisions de précipitations

En termes de prévision globale des précipitations, le modèle d’apprentissage par transfert est plus performant que le GFS.La réduction d'échelle du réseau neuronal convolutif a considérablement amélioré la précision spatiale, avec des coefficients de corrélation généralement plus élevés et une erreur quadratique moyenne (RMSE) significativement plus faible, comblant efficacement l'écart entre le modèle et les observations. L'introduction de l'apprentissage par transfert a renforcé la robustesse du modèle dans la prévision des précipitations d'intensité modérée à élevée, réduisant ainsi les sous-estimations. Globalement, l'apprentissage par transfert a surpassé les autres modèles pour les prévisions un à trois jours à l'avance, avec des performances particulièrement élevées pour les prévisions deux jours à l'avance.

Diagramme de séries chronologiques des précipitations observées et des prévisions du modèle d'apprentissage par transfert

Dans la prévision des précipitations extrêmes, l’apprentissage par transfert améliore la capacité du modèle à identifier les échantillons extrêmes.Lors du test des quantiles 95% et 99%, la précision de prédiction temporelle du modèle d'apprentissage par transfert est supérieure de 60% à 400% à celle du GFS. Les prévisions du premier et du deuxième jour permettent d'anticiper la plupart des processus pluviométriques et de réduire efficacement le taux de fausses alertes.

Différences spatiales dans les points de distribution des bulles entre différents sites

Données comparatives du GFS, du réseau neuronal convolutif et du modèle d'apprentissage par transfert en termes de taux de réussite et de taux de fausses alarmes

Modèle de performance régionale et application pratique

L'étude a validé la capacité du modèle à synchroniser les prévisions de précipitations dans différentes régions de Mumbai grâce à des méthodes de synchronisation des événements et de regroupement spatial. Les résultats ont montré que le modèle d'apprentissage par transfert surpassait non seulement le modèle pré-optimisé pour les prévisions ponctuelles, mais reproduisait également les caractéristiques de regroupement spatial entre les sites.

Comparaison des scores du GFS (rouge), du réseau neuronal convolutif (bleu) et du modèle d'apprentissage par transfert (vert) sur tous les sites d'observation

En construisant un grand modèle de souveraineté locale, l’Inde accélère son entrée dans le domaine de l’intelligence artificielle

En fait, outre l’attention portée par la communauté universitaire à l’application des réalisations de l’IA telles que les modèles de prévision de la mousson,Le gouvernement indien est également à la pointe du développement de l’IA.Ashwini Vaishnaw, ministre de l'Électronique et des Technologies de l'information, a récemment annoncé le lancement de la « Mission IndiaAI » nationale, dont l'objectif est d'achever le développement de plusieurs modèles fondamentaux autochtones dans les six à dix prochains mois. Ces modèles linguistiques à grande échelle seront conçus en tenant compte de l'environnement multilingue et multiculturel de l'Inde et optimisés pour les besoins sociaux locaux. À cette fin, l'Inde a acquis environ 18 600 GPU du monde entier pour établir l'IndiaAI Compute Facility, garantissant ainsi un approvisionnement continu en puissance de calcul de base.

en même temps,Afin de former des technologies de base indépendantes et contrôlables, le gouvernement indien a également sélectionné la société locale d'IA Sarvam comme partenaire clé pour entreprendre la tâche de construire le premier « grand modèle souverain » de l'Inde.Ce modèle sera capable de gérer plusieurs langues en Inde et mettra l'accent sur le raisonnement et l'adaptabilité aux scénarios d'application à grande échelle. À l'avenir, il pourra servir à de nombreux domaines, tels que la santé et les affaires gouvernementales.

Par ailleurs, le gouvernement indien a lancé la plateforme de données AI Kosha, qui vise à centraliser la gestion, l'ouverture et le partage de données publiques et non sensibles pouvant servir à l'entraînement de l'IA. L'India AI Compute Facility offrira également des droits d'utilisation de GPU subventionnés aux startups et aux équipes de recherche.Nous espérons construire rapidement un environnement de R&D comparable à ceux de l’Europe, de l’Amérique et de l’Asie de l’Est.

À mesure que la mission IndiaAI progresse, il n’est pas difficile de prévoir que l’Inde passera progressivement du statut de suiveur à celui de participant actif dans le paysage mondial de la concurrence en matière d’IA.

Liens de référence :

1.https://timesofindia.indiatimes.com/technology/artificial-intelligence/government-selects-indian-ai-company-sarvam-to-develop-nations-first-sovereign-large-language-model/articleshow/120645896.cms

2.https://indiaai.gov.in/article/union-minister-of-electronics-it-railways-and-i-b-announces-the-availability-of-18-000-affordable-ai-compute-units

3.https://www.electronicsforyou.biz/industry-buzz/indiaai-mission-expands-to-18693-gpus-for-rd/