HyperAI

Le Modèle De Prévision Des Inondations De Google Est À Nouveau Publié Dans Nature, Battant Le Système N°1 Mondial Et Couvrant Plus De 80 Pays

特色图像

Il est rapporté dans « Le Livre des Documents · Le Canon de Yao » : « Le déluge fait rage, balayant les montagnes et les collines, et submergeant le ciel. Les gens demandent conseil. » À l’époque de Yao et de Shun, les inondations rendaient le peuple misérable. Yao et Shun ont décidé de trouver quelqu'un pour contrôler l'inondation. Gun a été initialement nommé mais a échoué. Plus tard, Dayu hérita de la carrière de son père et contrôla à nouveau le déluge. D'où la légende selon laquelle « Dayu a contrôlé le déluge pendant treize ans et est passé trois fois devant sa maison sans entrer ».
En juillet 2023, une rare tempête de pluie torrentielle causée par le typhon Dusurui a frappé Pékin et un débit de pointe record s'est produit dans le bassin de la rivière Daqing. Selon le Quotidien du Peuple en ligne, cette catastrophe due aux inondations a touché plus de 1,29 million de personnes à Pékin, avec plus de 59 000 maisons effondrées, plus de 147 000 maisons gravement endommagées et la superficie des cultures touchées atteignant plus de 225 000 acres.

Source de l'image : China News Service

Depuis l’Antiquité jusqu’à nos jours, les êtres humains se sont souvent retrouvés dans une position de faiblesse face aux catastrophes naturelles telles que les inondations. Grey Nearing, chercheur chez Google, a montré dans son article qu'un système efficace de prévision des inondations peut réduire les décès liés aux inondations de 43% et les pertes économiques de 35% à 50%. On peut constater que la mise en place d’un système de prévision des inondations est un moyen important pour les humains de faire face aux catastrophes liées aux inondations.
Le système actuel de prévision des inondations à l’échelle mondiale repose principalement sur des stations d’observation installées le long des rivières. En raison du coût de déploiement, le nombre de débitmètres installés dans les pays à faible revenu et à revenu intermédiaire est souvent faible, ce qui rend difficile pour ces pays de préparer à l’avance des mesures de réponse en cas d’inondation.. La Banque mondiale estime que si les systèmes de prévision des inondations dans les pays en développement étaient mis au niveau de ceux des pays développés, environ 23 000 vies pourraient être sauvées chaque année. Il est urgent de mettre en place un système de prévision des inondations pour les bassins fluviaux dépourvus de stations de surveillance.
Heureusement, avec le développement de la science et de la technologie, l’application de l’intelligence artificielle (IA) dans le domaine des inondations a apporté de l’espoir pour la défense contre les inondations dans les bassins sans stations de surveillance.Grey Nearing et son équipe de Google Research ont développé un modèle de prévision fluviale basé sur l'apprentissage automatique.Le modèle peut réaliser des prévisions d’inondation fiables cinq jours à l’avance. Lorsqu’il s’agit de prévoir des inondations qui se produisent une fois tous les cinq ans, ses performances sont meilleures ou équivalentes à celles de la prévision actuelle des inondations qui se produisent une fois par an. Le système peut couvrir plus de 80 pays.
Points saillants de la recherche :
* Le modèle de prévision fluviale a de meilleures capacités de prévision que GloFAS, le système de prévision des inondations le plus avancé au monde

* Fournir un meilleur support pour les alertes d'inondation dans les bassins non jaugés

Adresse du document :
https://www.nature.com/articles/s41586-024-07145-1
Adresse de téléchargement du jeu de données :
https://hyper.ai/datasets/30647
Suivez le compte officiel et répondez « Flood Forecasting System » pour obtenir le PDF complet

Ensemble de données : provenant de 5 680 bassins versants

L'ensemble de données complet de l'étude comprend les entrées du modèle et les valeurs cibles (de ruissellement) de 5 680 bassins versants, sur la base desquels les chercheurs ont formé et testé le modèle.

5 680 emplacements de stations de surveillance du ruissellement utilisés pour former le modèle

Cette étude utilise trois types de données publiques comme données d’entrée, provenant principalement de sources gouvernementales :
* Données statiques sur les bassins versants représentant des variables géographiques et géophysiques :Du projet HydroATLAS, comprenant des indicateurs climatiques à long terme (précipitations, température, couverture neigeuse), la couverture terrestre et les attributs anthropiques.
* Données de séries chronologiques météorologiques historiques :D'après l'analyse unifiée mondiale des précipitations quotidiennes basée sur la jauge IMERG de la NASA, la NOAA CPC et la réanalyse terrestre ERA5 de l'ECMWF. Les variables comprennent les précipitations totales quotidiennes, la température de l’air, le rayonnement thermique, les chutes de neige et la pression de surface.
* Données de séries chronologiques de prévisions météorologiques sur une période de sept jours :Ces données proviennent du modèle atmosphérique HRES de l'ECMWF et les variables météorologiques sont les mêmes que ci-dessus.

Architecture du modèle : construction d'un modèle de prévision fluviale basé sur LSTM

Architecture du modèle de prévision fluviale basé sur LSTM

Cette étude a utilisé deux applications de réseaux de mémoire à long terme (LSTM) pour construire un modèle de prévision fluviale, dont le cœur est le mécanisme encodeur-décodeur (modèle encodeur-décodeur).Hindcast LSTM reçoit des données météorologiques historiques, Forecast LSTM reçoit des données météorologiques prévues et la sortie du modèle est le paramètre de distribution de probabilité de chaque pas de temps de prédiction, qui représente la prédiction de probabilité du débit volumique d'une rivière spécifique à un moment précis.
De plus, les chercheurs ont entraîné le modèle sur 50 000 mini-lots et toutes les données d’entrée ont été normalisées au préalable. Pour améliorer la capacité d'apprentissage du modèle, les chercheurs ont défini la taille cachée des LSTM de l'encodeur et du décodeur à 256 états de cellule, ainsi que le réseau de transfert d'état de cellule linéaire et le réseau de transfert d'état caché non linéaire.

Optimisation du modèle : la validation croisée réduit l'erreur de prédiction

Les chercheurs ont utilisé la validation croisée pour former le modèle de prévision fluviale sur 5 680 jauges de cours d'eau et le tester hors échantillon afin de garantir que la capacité de généralisation du modèle était efficacement évaluée et d'améliorer la fiabilité des prévisions.
Premièrement, dans la dimension temporelle, les plis de validation croisée sont conçus de manière à ce que les données de test de toute station de surveillance au cours d’une année ne chevauchent pas les données de formation qu’elle utilise. Dans la dimension spatiale, une validation croisée k-fold (k = 10) a été utilisée pour diviser uniformément les données dans la dimension spatiale. Ces deux processus de validation croisée sont répétés pour éviter les fuites de données entre la formation et les tests.
Deuxièmement, pour examiner plus en détail les performances du modèle dans différentes régions géographiques et conditions environnementales, les chercheurs ont également mené davantage de types d’expériences de validation croisée, y compris, mais sans s’y limiter : la segmentation spatiale non aléatoire selon les continents (k = 6), différentes zones climatiques (k = 13) et des groupes de bassins versants hydrologiquement séparés (k = 8). * Validation croisée k-fold : divisez l'ensemble de données en k sous-ensembles, 1 sous-ensemble est utilisé pour la validation et les k-1 sous-ensembles restants sont utilisés pour la formation. Répétez la validation croisée k fois, validez chaque sous-ensemble une fois et faites la moyenne des k résultats pour obtenir l'évaluation finale du modèle.

Conclusion expérimentale : les performances sont meilleures que celles du système de prévision des inondations le plus avancé au monde

Afin d'évaluer la fiabilité des prévisions d'inondations, les chercheurs ont comparé le modèle de prévision fluviale avec le système de prévision des inondations le plus avancé au monde, GloFAS (Global Flood Awareness System).

Modèle de prévision fluviale et modèle GloFAS en temps réel
Différence dans les scores F1 pour prédire les événements avec une période de retour de 2 ans

* Le rouge indique que la différence est comprise entre -0,2 et 0

* Le vert indique que la différence est comprise entre 0 et 0,2
Dans un premier temps, les chercheurs ont analysé la distribution des différences dans les scores F1 entre le modèle de prévision fluviale et le modèle GloFAS pour prédire les événements avec une période de retour de 2 ans sous prévision immédiate de 1984 à 2021.
Les résultats montrent queLe modèle de prévision fluviale est plus performant que le modèle GloFAS dans 701 stations de surveillance TP3T (un total de 3 673).

Prédiction instantanée
Distribution de la précision et du rappel pour les événements avec différentes périodes de retour

* La ligne pointillée bleue est la ligne de référence

* N est le nombre de stations de surveillance
Deuxièmement, les chercheurs ont analysé la distribution de la précision et du rappel pour les événements avec différentes périodes de retour sous prédiction instantanée.
Les résultats montrent que le modèle de prévision fluviale présente une plus grande fiabilité dans la prédiction de tous les événements de la période de retour. En ce qui concerne la précision de la prévision des événements extrêmes, il n'y a pas de différence significative entre le modèle de prévision fluviale sur la période de retour de 5 ans et le GloFAS sur la période de retour d'un an, mais le taux de rappel est supérieur à celui du GloFAS.Cela montre que la précision du modèle de prévision fluviale dans la prédiction d'événements avec une période de retour de 5 ans est meilleure ou équivalente à la précision de GloFAS dans la prédiction d'événements avec une période de retour d'un an, c'est-à-dire que sa fiabilité dans la prédiction d'événements d'inondation avec une période de retour plus longue est meilleure que celle du modèle le plus avancé dans la prédiction d'événements d'inondation avec une période de retour d'un an.* Période de retour : Le nombre d'années pendant lesquelles un pic de crue se produit est la période de retour. Plus la période de retour est longue, plus l’ampleur de la crue est grande, et plus la période de retour est courte, plus la crue est petite.

Répartition des scores F1 pour les événements avec différentes périodes de retour lors de la prévision de 0 à 7 jours à l'avance
La ligne pointillée bleue est la ligne de référence

Troisièmement, les chercheurs ont analysé la distribution des scores F1 pour les événements avec différentes périodes de retour lors de la prévision de 0 à 7 jours à l’avance.
Les résultats montrent que pour les événements de prévision avec une période de retour de 1 an (a), 2 ans (b), 5 ans (c) et 10 ans (d), les scores F1 des modèles de prévision fluviale sont soit supérieurs aux prévisions immédiates de GloFAS, soit n'ont pas de différence significative jusqu'à 5 jours à l'avance.Cela montre que la capacité de prévision des crues du modèle de prévision fluviale est meilleure ou égale à celle de GloFAS dans les 5 jours à l'avance.

Scores F1 par situation géographique et période de retour

Quatrièmement, les chercheurs ont analysé la distribution des scores F1 lors de la prédiction d’événements avec différents emplacements géographiques et périodes de retour.
Les résultats montrent queIl existe des différences significatives dans la fiabilité des deux modèles selon les zones géographiques.De plus, lors de la prédiction d'événements avec une période de retour de 1 an (a), 2 ans (b), 5 ans (c) et 10 ans (d), les scores F1 des modèles de prévision fluviale à différents emplacements géographiques étaient soit plus élevés, soit ne présentaient aucune différence significative par rapport à GloFAS.

De l'EFAS européen au modèle chinois du Xinanjiang, l'IA est devenue une ligne de défense intelligente

En fait, dès 2021, lorsque Google a présenté les résultats de recherche de sa technologie d'IA lors de l'événement « Inventors@Google », il avait mentionné le système de prévision des inondations basé sur l'apprentissage automatique Google Flood Hub. À cette époque, le système était principalement utilisé en Inde et utilisait la visualisation pour permettre aux populations locales de comprendre la situation des inondations. Après trois ans de développement, le dernier système de prévision des inondations de Google peut désormais être étendu à d'autres bassins fluviaux sans stations de surveillance, couvrant plus de 80 pays.
Il existe un système similaire, le Système européen de sensibilisation aux inondations (EFAS), qui utilise des prévisions météorologiques et des modèles hydrologiques avancés, combinés à des algorithmes d’apprentissage automatique, pour établir des prévisions d’inondations fiables dans toute l’Europe au moins dix jours à l’avance et envoyer des alertes précoces précises aux centres nationaux et locaux de prévention des inondations dans les États membres.
De plus, étant l’un des pays où les inondations sont fréquentes, environ 2/3 du territoire de notre pays est menacé d’inondations à des degrés divers. Selon les statistiques, entre 1991 et 2020, le nombre annuel moyen de décès ou de personnes disparues dus aux inondations dans mon pays a dépassé 2 000, le nombre cumulé de morts a dépassé 60 000 et les pertes économiques directes annuelles moyennes ont été d'environ 160,4 milliards de yuans.

Source de l'image : Carte de Chine

Face aux risques d'inondation, le modèle Xin'anjiang développé indépendamment par mon pays, basé sur une accumulation pratique à long terme et une étude approfondie des lois hydrologiques, divise l'ensemble du bassin fluvial en plusieurs sous-bassins unitaires et prend en compte l'impact de facteurs tels que la topographie, le sol et la végétation sur les processus hydrologiques. Il fournit des résultats de prévision hydrologique précis et est largement utilisé dans la prévention des inondations et la réduction des catastrophes.
En fait, l’humanité n’a jamais cessé d’explorer des mesures de prévention des inondations plus efficaces. Bien qu’il soit impossible d’éliminer fondamentalement les inondations, grâce à des systèmes avancés de prévision des inondations, les catastrophes peuvent être prédites à l’avance et des mesures peuvent être prises pour réduire considérablement l’impact négatif des inondations sur la société humaine. Aujourd’hui, le système de prévision des inondations basé sur la technologie de l’IA ne se limite plus à une zone spécifique et pourrait couvrir le monde entier à l’avenir, protégeant ainsi davantage de citoyens des risques d’inondation.

Références :
1.
http://bj.people.com.cn/n2/2023/0809/c14540-40525241.html
2.https://www.sohu.com/a/766008856_473283
3. https://www.sohu.com/a/745381603_121687414
4.https://european-flood.emergency.copernicus.eu/en/european-flood-awareness-system-efas
5.https://developer.baidu.com/article/details/3096974
6.https://blog.research.google/2024/03/using-ai-to-expand-global-access-to.html
7.https://m.jiemian.com/article/6809946.html