HyperAIHyperAI

Command Palette

Search for a command to run...

Une Équipe De l'Université Des Sciences Et Technologies De Hong Kong a Proposé Un Modèle d'interpolation Et De Prédiction Spatiotemporelle Pour Le Diagnostic De La Santé De l'eau À l'échelle Mondiale, Permettant Une Prédiction Précise De La Distribution Spatiotemporelle De La Chlorophylle a Le Long Des Zones côtières.

Featured Image

L’apport de nutriments provenant de la terre et l’hydrodynamique active font des eaux côtières l’un des écosystèmes marins les plus productifs au monde, mais comportent également des risques potentiels tels qu’une eutrophisation grave et une hypoxie.La prédiction de la distribution spatiotemporelle de la chlorophylle a (Chl_a) est un moyen important de diagnostiquer l’état de santé des écosystèmes côtiers.

Cependant, les outils existants sont encore insuffisants pour soutenir les approches analytiques basées sur la prédiction de la distribution spatiotemporelle de la chlorophylle a.Parmi elles, les méthodes traditionnelles de couplage hydrodynamique-biogéochimique ont du mal à analyser le transfert de nutriments dans les écosystèmes marins, et des facteurs tels que le flux d'énergie et la biomasse sont difficiles à intégrer dans le calcul ; les méthodes de prédiction basées sur les données sont susceptibles d'accumuler des erreurs dans le processus d'intégration à long terme des systèmes non linéaires.

Dans ce contexte, une équipe de recherche de l’Université des sciences et technologies de Hong Kong a développé un modèle d’interpolation et de prédiction spatio-temporelle (STIMP) basé sur l’intelligence artificielle pour prédire la chlorophylle a dans l’océan côtier. Le modèle STIMP résout les problèmes causés par des données incomplètes, des changements temporels non stationnaires et une hétérogénéité spatiale en intégrant des modules spécialement conçus, offrant un nouveau paradigme pour prédire la chlorophylle a marine sous des contraintes temporelles et spatiales.

Les résultats de recherche pertinents ont été publiés dans Nature Communications sous le titre « Spatiotemporal Imputation and Prediction Model ».

Points saillants de la recherche :

* Développé le modèle STIMP et proposé une architecture « interpolation + prédiction » en deux étapes pour atténuer efficacement les problèmes de taux élevés de mesures manquantes et de perte de modèles spatio-temporels, et quantifier l'incertitude des prévisions ;

* Intègre le modèle de diffusion de débruitage spatiotemporel (STDDM), le transformateur linéaire temporel (TLT) et le réseau neuronal à graphes spatiaux hétérogènes (HSGNN) pour relever les trois principaux défis que sont les données incomplètes, les changements temporels non stationnaires et l'hétérogénéité spatiale ;

*Des études empiriques ont été réalisées dans quatre zones typiques : l'estuaire de la rivière des Perles, l'estuaire du fleuve Yangtze, le nord du golfe du Mexique et la baie de Chesapeake, vérifiant l'efficacité globale de la capacité du modèle STIMP à prédire la distribution spatiotemporelle de la chlorophylle a.

Adresse du document :

https://go.hyper.ai/BjOR5

Suivez le compte officiel et répondez « distribution côtière de la chlorophylle » pour obtenir le PDF complet

Ensemble de données mesurées sur la chlorophylle a MODIS

Cette étude a utilisé un ensemble de données de chlorophylle-a mesurées au large de Hong Kong et un ensemble de données de réflectance par télédétection du satellite Sunflower pour construire des modèles d'inversion de la chlorophylle-a à trois profondeurs différentes. Les données MODIS Chl-a utilisées dans l'étude ont été rendues publiques dans le cadre du projet Aqua du spectroradiomètre imageur à résolution moyenne (MODIS), et les données MODIS Chl-a traitées sont disponibles sur Zenodo.

Site Web de Zenodo :

https://doi.org/10.5281/zenodo.14638405

Méthode STIMP basée sur l'apprentissage profond

L'équipe de recherche a utilisé une méthode basée sur l'apprentissage profond pour saisir les observations de chlorophylle a des océans côtiers et une carte spatiale contenant les coordonnées géographiques des observations dans l'architecture STIMP afin d'obtenir un ensemble complet de données sur la chlorophylle a, estimant et prédisant ainsi avec précision la chlorophylle a dans les océans côtiers.

Informations sur l'observation de la chlorophylle a dans des zones côtières représentatives du monde entier

Architecture en deux étapes du modèle STIMP

STIMP décompose la prédiction de la chlorophylle a en deux étapes consécutives : interpolation et prédiction.Au cours du processus d'interpolation, l'étude a utilisé des modules d'intégration spatiotemporelle pour capturer simultanément la structure spatiale et la dynamique temporelle, en reconstruisant plusieurs distributions spatiotemporelles complètes potentielles de chlorophylle a à partir d'observations partielles ; dans l'étape de prédiction, STIMP utilisera les règles de Rubin basées sur la distribution spatiotemporelle reconstruite de la chlorophylle a pour obtenir la valeur de prédiction finale de la chlorophylle a en faisant la moyenne des résultats de plusieurs processus d'interpolation et de prédiction.

Aperçu de l'architecture en deux phases du modèle STIMP

Trois modules intégrés de base du modèle STIMP

Le développement rapide des observations par télédétection par satellite offre des possibilités de développement de méthodes de prédiction spatiotemporelle de la chlorophylle-a à grande échelle, basées sur les données. Cependant, cela présente également des défis tels que l'incomplétude des données, la variation temporelle non stationnaire et l'hétérogénéité spatiale. Pour y remédier, le modèle STIMP a conçu trois modules intégrés clés permettant de réaliser la prédiction spatiotemporelle de la chlorophylle-a :

Modèle de diffusion de débruitage spatiotemporelModèle de diffusion et de débruitage spatiotemporel (STDDM) : Appliqué à la fonction d'interpolation, le STDDM reconstruit la distribution spatiotemporelle complète en cas de taux d'absence élevé pendant la phase d'interpolation. Ce module décompose les tâches complexes en tâches plus simples, améliorant progressivement le rapport signal/bruit pour assurer la transition entre observations incomplètes et données complètes.

*  Transformateur linéaire temporelTransformateur linéaire temporel (TLT) : Il est utilisé pour capturer les modèles de variation temporelle non stationnaire. Il calcule les dépendances de l'ensemble de la série temporelle grâce à un mécanisme d'auto-attention, conservant ainsi les informations clés sur les variations dynamiques de la chlorophylle a. Il calcule ensuite tous les éléments de la série temporelle pour faciliter la compréhension du modèle temporel de la chlorophylle a.

Réseaux neuronaux à graphes spatiaux hétérogènesRéseau neuronal à graphes spatiaux hétérogènes (HSGNN) : cette approche aborde l'hétérogénéité spatiale et utilise un pool de paramètres pour générer des paramètres spécifiques à l'emplacement, garantissant ainsi la sensibilité aux différences régionales dans différents environnements géographiques.

Ces trois modules intégrés garantissent que le modèle STIMP peut réaliser une estimation et une prédiction robustes dans les étapes d'interpolation et de prédiction face à des données incomplètes, une dynamique temporelle complexe et des différences spatiales importantes.

Validation des performances du STIMP

Performances d'interpolation spatio-temporelle de STIMP

Cette étude démontre l'efficacité du modèle STIMP pour l'interpolation spatio-temporelle, en prenant l'exemple de l'estuaire de la rivière des Perles. Les chercheurs ont sélectionné des données d'observation provenant de l'ensemble de l'estuaire de la rivière des Perles entre le 7 février 2015 et le 2 février 2016, et ont reconstitué la distribution de la chlorophylle a à l'aide de STIMP et de méthodes de référence, notamment la fonction orthogonale empirique d'interpolation des données (DINEOF), l'autoencodeur masqué (MaskedAE) et l'interpolation linéaire (Lin-ITP).

Les expériences montrent que lorsque le taux moyen de mesure manquante dans l'estuaire de la rivière des Perles atteint 50,29%, le modèle STIMP réduit l'erreur absolue moyenne (MAE) de 45,90% à 77,35% par rapport à DINEOF dans une tâche d'interpolation d'un an, et la réduit encore de 10,20% à 40,38% par rapport au deuxième meilleur modèle. STIMP préserve efficacement les relations spatiales lors du processus d'interpolation, produisant des valeurs plus élevées près du littoral et des valeurs similaires dans la plupart des zones. Même lorsque le taux de données manquantes est élevé, STIMP peut reconstituer efficacement des données complètes.

Distribution mesurée et estimée de la chlorophylle-a dans l'estuaire de la rivière des Perles

De plus, STIMP préserve efficacement les relations temporelles lors de l'interpolation. Lors de l'interpolation de cinq emplacements uniques entre le 7 février 2015 et le 22 septembre 2022, STIMP intègre davantage de fluctuations qu'une simple interpolation linéaire.

Chlorophylle a estimée par STIMP sur cinq sites

Français L'étude a également validé l'efficacité du STIMP dans les océans côtiers du monde entier. Dans l'estuaire du fleuve Yangtze, le MAE du STIMP a diminué de 68,311 TP3T à 90,921 TP3T par rapport au DINEOF, et de 15,621 TP3T à 42,671 TP3T par rapport à la meilleure méthode d'IA suivante. Dans le nord du golfe du Mexique, le MAE du STIMP a diminué de 69,421 TP3T à 74,881 TP3T par rapport au DINEOF ; et dans la baie de Chesapeake, le MAE du STIMP a diminué de 62,081 TP3T à 75,631 TP3T par rapport au DINEOF.Dans l’ensemble, STIMP peut maintenir des performances stables dans différentes conditions de taux manquant et peut toujours reconstruire la véritable structure spatio-temporelle sous un taux manquant élevé.

Performances de prédiction spatiotemporelle de STIMP

Les chercheurs ont également vérifié la supériorité des performances de prévision à long terme de STIMP grâce à des expériences de prévision. Comparée à la méthode de référence, l'erreur absolue moyenne (EMA) de STIMP a diminué de 6,541 TP3T pour les prévisions à un an, de 13,681 TP3T pour les prévisions à deux ans, de 13,681 TP3T pour les prévisions à trois ans et de 13,771 TP3T pour les prévisions à trois ans, surpassant ainsi les autres méthodes de prévision.

Performances MAE des modèles STIMP et de référence dans les prévisions à 1 an, 2 ans et 3 ans

aussi,Après avoir rempli les données, la prédiction de la distribution par STIMP est considérablement améliorée.Dans les zones où le taux de données manquantes est élevé, les résultats de prédiction de STIMP ont tendance à être plus améliorés que ceux de PredRNN, ce qui prouve que le remplissage des données avant la prédiction aide STIMP à capturer efficacement la distribution spatiale et les signaux saisonniers de la chlorophylle a.

MAE des valeurs réelles et PredRNN, STIMP sans interpolation et valeurs prédites STIMP
Relation entre l'amélioration des performances apportée par l'interpolation et le taux de données manquantes

Prenons l'exemple de l'estuaire de la rivière des Perles : le STIMP améliore significativement son MAE prévisionnel par rapport au modèle numérique CMOMS et à la méthode d'apprentissage profond PredRNN. Pour les prévisions à un an, le MAE est réduit de 6,541 TP3T à 13,681 TP3T, pour les prévisions à deux ans de 13,681 TP3T et pour les prévisions à trois ans de 13,771 TP3T à 32,011 TP3T. À chaque endroit, le STIMP obtient des améliorations du MAE allant jusqu'à 53,781 TP3T par rapport au CMOMS, contre 74,631 TP3T, et de 1,831 TP3T par rapport à PredRNN, contre 30,281 TP3T.

Dans l'estuaire du fleuve Yangtze, le nord du golfe du Mexique et la baie de Chesapeake, les performances de prédiction globales de STIMP ont également montré une amélioration significative par rapport à la méthode PredRNN, et elles peuvent mieux maintenir la périodicité des données.Dans l’ensemble, STIMP démontre l’efficacité et la robustesse de son architecture en deux étapes dans le traitement des données d’observation spatio-temporelles incomplètes.

Recherche et équipe interdisciplinaires « AI+Océan »

Les intérêts de recherche de l’équipe dirigée par Yang Can et Gan Jianping de l’Université des sciences et technologies de Hong Kong couvrent plusieurs domaines, notamment les mathématiques, les statistiques, l’intelligence artificielle et l’océanographie physique.

Parmi eux, Yang Can, professeur de mathématiques à l'Université des sciences et technologies de Hong Kong et directeur adjoint du Laboratoire de biointelligence Big Data, se consacre à la recherche innovante en apprentissage statistique et en méthodologies d'intelligence artificielle, en se concentrant sur l'application de méthodes de pointe telles que l'apprentissage profond, les modèles génératifs et les réseaux de neurones graphiques à la modélisation et à la prédiction de données complexes de grande dimension. Ces dernières années, il a élargi ses recherches aux sciences marines et à la santé publique, promouvant activement la recherche interdisciplinaire « IA + Océan ». Auparavant, l'équipe de Yang Can a développé les outils d'analyse GWAS accélérés BOOST/GBOOST, proposé une méthode de prédiction du risque multiphénotypique pour le LEP et conçu le cadre génératif VGrow pour faciliter la traduction des données génétiques en traits faciaux pour les populations non européennes et américaines.

Gan Jianping, professeur titulaire et directeur du département des sciences océaniques de l'Université des sciences et technologies de Hong Kong, étudie depuis longtemps la dynamique de la circulation des océans côtiers et du plateau continental, ainsi que leurs processus de couplage avec les écosystèmes. Il se concentre sur des domaines de recherche tels que la santé écologique côtière, la lutte contre la pollution et le développement durable du climat régional. En océanographie physique, l'équipe de Gan Jianping a développé la plateforme de jumeau numérique océanique régional WavyOcean 2.0, capable d'intégrer la simulation des processus océaniques, les SIG, la modélisation des données du bâtiment (BIM) et les technologies de jumeaux numériques pour réaliser une modélisation couplée tridimensionnelle du système océan-terre-atmosphère. Elle permet la visualisation dynamique et l'analyse interactive des flux océaniques, de l'évolution biogéochimique, des précipitations et de la diffusion de la pollution, couvrant la région de la Grande Baie et la côte chinoise. Grâce à des observations de terrain et à des simulations de modèles, l'équipe a révélé pour la première fois que la région de la mer de Chine méridionale présente une structure de circulation bicouche à rotation alternée, corrigeant ainsi les écarts structurels des modèles océaniques précédents.

Références :

1.https://pubs.acs.org/doi/10.1021/cr300014x

Obtenez des articles de haute qualité et des articles d'interprétation approfondis dans le domaine de l'IA4S de 2023 à 2024 en un seul clic⬇️