HyperAIHyperAI

Command Palette

Search for a command to run...

Une Équipe De Recherche Européenne a Proposé SeaCast, Un Modèle Régional De Prévision Océanique À Haute Résolution Capable De Fournir Des Prévisions À 15 Jours En Seulement 20 secondes.

Featured Image

Les systèmes de prévision marine jouent un rôle de soutien indispensable dans des domaines tels que la sécurité maritime, la gestion de l'aquaculture, la prévention et le contrôle des risques côtiers et la surveillance des écosystèmes marins. Auparavant, ces systèmes fonctionnaient principalement grâce à des modèles numériques basés sur des équations physiques.Prenons comme exemple le système de prévision méditerranéen (MedFS) au sein du service de surveillance de l'environnement marin Copernicus (CMEMS) : ce système utilise un modèle numérique couplé vagues-courants bidirectionnel pour fournir des prévisions océaniques opérationnelles jusqu'à 10 jours avec une résolution horizontale d'environ 4 kilomètres (1/24°).Elle est devenue une norme de référence reconnue en matière de prévision dans la région méditerranéenne.

Cependant, une grande précision s'accompagne souvent de coûts de calcul considérables. MedFS requiert 89 cœurs de processeur et met environ 70 minutes pour effectuer une prévision à 10 jours, produisant un champ complet de l'état de la mer couvrant 141 couches de profondeur. Une telle charge de calcul limite son utilisation aux applications exigeant une grande réactivité, telles que la simulation rapide de scénarios ou la prévision d'ensemble, ce qui rend difficile une réponse optimale aux situations d'urgence lors d'opérations réelles.

Des progrès significatifs ont été réalisés ces dernières années dans le domaine des prévisions météorologiques basées sur l'apprentissage automatique. Grâce à des architectures avancées telles que les Transformers, les opérateurs neuronaux et les réseaux neuronaux graphiques, les méthodes d'apprentissage automatique ont atteint des performances comparables, voire supérieures, à celles des prévisions numériques traditionnelles à l'échelle mondiale. Cependant, l'application de ces résultats concluants à des scénarios de prévision océanique régionale à haute résolution se heurte à de nombreux obstacles :La répartition irrégulière terre-mer, les conditions aux limites latérales complexes et la nécessité d'une caractérisation détaillée des variables de stratification verticale rendent difficile l'adaptation directe des modèles d'IA océaniques à l'échelle mondiale existants aux tâches régionales.

Pour combler ce fossé technologique, une équipe de recherche conjointe composée de l'Université d'Helsinki en Finlande, du Centre de recherche sur le changement climatique méditerranéen et de l'Université de Salento en Italie...Un modèle de réseau neuronal graphique appelé SeaCast, spécifiquement conçu pour la prévision océanique régionale, a été développé.Le modèle a réalisé plusieurs avancées majeures dans son architecture technique : en optimisant le processus de construction, d’apprentissage et d’évaluation du graphe, il peut s’adapter avec précision à la structure géométrique irrégulière de la grille océanique ; en introduisant des données clés sur le champ de forçage atmosphérique près de la surface de la mer, il peut améliorer la corrélation physique des prévisions ; en couplant le forçage aux limites latérales, il peut caractériser avec précision le processus d’entrée et de sortie de l’eau de mer et assurer la cohérence avec le système de circulation océanique global, permettant ainsi une prévision de haute précision des conditions océaniques.

Points saillants de la recherche :

* Cette étude propose SeaCast, un modèle d'apprentissage automatique de prévision océanique régionale à haute résolution basé sur des réseaux neuronaux graphiques.

Ce modèle exploite directement les réanalyses historiques et les données analytiques pour prévoir les principaux éléments de la mer Méditerranée. Il surpasse le modèle opérationnel MedFS à tous les niveaux verticaux et pour tous les éléments simulés.

* Après l'entraînement du modèle, une prévision sur 15 jours sur 18 niveaux verticaux sur une grille de 1/24° peut être réalisée en seulement 20 secondes sur un seul GPU, beaucoup plus rapidement que le modèle de base physique exécuté sur un cluster CPU.

Adresse du document :

https://www.nature.com/articles/s41598-025-31177-w

Voir plus d'articles :https://hyper.ai/papers

Jeux de données : état de l’océan, forçage atmosphérique, limite latérale et données de validation par satellite

L'ensemble de données constitué dans cette étude couvre quatre grandes catégories : l'état de l'océan, le forçage atmosphérique, le forçage des limites latérales et les observations satellitaires.Fournit un support système pour la formation, la validation et les tests du modèle SeaCast.

Les données sur l'état de l'océan proviennent principalement du Système d'analyse et de prévision physique de l'océan Méditerranée.Le système repose sur un couplage bidirectionnel du modèle océanique NEMO v4.2 et du modèle de vagues WAVEWATCH III v6.07. Afin d'améliorer la précision de la simulation, il utilise le schéma d'assimilation variationnelle tridimensionnel OceanVar, qui fusionne efficacement les observations de terrain et les données de télédétection satellitaire. L'équipe de recherche a sélectionné 18 profondeurs, espacées de 200 mètres ou moins, pour la modélisation, et les données topographiques ont été obtenues à partir de la base de données topographiques mondiale GEBCO par interpolation bilinéaire.

Le modèle a d'abord été entraîné à l'aide de données moyennes journalières issues de la réanalyse de la Méditerranée sur 35 ans (1987-2021), puis affiné grâce aux données d'analyse opérationnelle de 2022-2023. Cet affinement visait à permettre au modèle d'apprendre les conditions océaniques récentes, de s'adapter aux exigences des scénarios opérationnels avec le champ d'analyse comme condition initiale et de prendre en compte les mises à jour du système opérationnel MedFS. La validation du modèle a utilisé les données d'analyse de janvier à juin 2024 (177 échantillons), tandis que les données de test étaient constituées de prévisions d'initialisation journalières du début juillet à la fin décembre 2024. Chaque initialisation a généré une prévision à 15 jours, et l'évaluation de la qualité des prévisions s'est poursuivie jusqu'au 14 janvier 2025 afin de couvrir intégralement l'horizon de prévision de SeaCast.

L'équipe de recherche a intégré la température de l'air à 2 mètres, la pression atmosphérique au niveau de la mer et la composante de contrainte du vent à 10 mètres calculée à partir de la composante du vent dans le forçage atmosphérique.Les données atmosphériques utilisées lors de la phase d'entraînement proviennent de données de réanalyse ERA5 à 6 heures et sont agrégées en moyennes journalières. Lors de la phase de test, les prévisions journalières agrégées à 6 heures issues du modèle de prévision d'ensemble du CEPMMT (ENS) et du système de prévision par intelligence artificielle (AIFS) ont été utilisées pour comparer l'impact de différents forçages atmosphériques. Le modèle utilise une fenêtre glissante de trois pas de temps consécutifs comme entrée de forçage atmosphérique afin de capturer les tendances à court terme.

De plus, l'équipe de recherche a défini la région du détroit de Gibraltar (à l'ouest de 5,2° O) et celle du détroit des Dardanelles (de 39,9° N à 40,4° N, de 25,9° E à 26,4° E) comme les limites latérales ouvertes du modèle, en utilisant les données de MedFS ou de prévisions océaniques mondiales pour fournir un forçage dynamique des limites. Sachant que les produits de prévision océanique de Copernicus ont généralement un délai de prévision de 10 jours, tandis que cette étude utilise une norme de prévision de 15 jours,L'équipe de recherche a utilisé une méthode d'extrapolation innovante pour extrapoler en continu et à cinq reprises le dernier état prédit de la région frontière.La durée de vieillissement du champ de forçage de la limite latérale est astucieusement prolongée, assurant ainsi la cohérence de la limite tout au long du processus de vieillissement.

Les données satellitaires sont principalement utilisées pour la validation des prévisions des modèles et l'évaluation des erreurs, et couvrent deux types de données : la température de la surface de la mer et les anomalies du niveau de la mer.La température de surface de la mer a été mesurée à l'aide du produit de fusion multi-capteurs Copernicus L3S (échelle diurne, résolution de 1/16°), intégrant uniquement les observations nocturnes afin d'éliminer les effets du réchauffement diurne. Lors de la validation, les prévisions du modèle ont été rééchantillonnées sur la grille L3S à des fins de comparaison. Les anomalies du niveau de la mer ont été mesurées à l'aide du produit quasi temps réel Copernicus de niveau 3, intégrant des observations à 5 Hz provenant de plusieurs satellites altimétriques, et filtrées pour réduire le bruit. Les valeurs de hauteur du niveau de la mer issues du modèle ont été converties en anomalies, puis reportées sur les coordonnées orbitales des satellites par interpolation bilinéaire pour validation.

SeaCast : un modèle régional de prévision océanique à haute résolution basé sur des réseaux neuronaux graphiques

SeaCast est un modèle de prévision océanique basé sur les données, conçu spécifiquement pour la région méditerranéenne, capable de fournir des prévisions océaniques jusqu'à 15 jours sur 18 niveaux verticaux sur une grille horizontale de 1/24° (environ 4 km).Sa résolution spatiale est cohérente avec le système opérationnel MedFS, et elle peut prédire des variables couvrant les courants zonaux stratifiés verticalement, les courants méridiens, la salinité, la température et la hauteur du niveau de la mer, totalisant 73 champs de prévision.

Le principal avantage de ce modèle réside dans son efficacité de calcul.Sur un seul GPU, SeaCast réalise une prévision complète sur 15 jours en seulement 20 secondes ;À l'inverse, MedFS nécessite 89 cœurs de processeur pour générer 141 couches verticales de résultats avec un pas de temps de 120 secondes, et il lui faut environ 70 minutes pour établir une prévision à 10 jours. Bien que leur fonctionnement soit fondamentalement différent, l'avantage en termes d'efficacité des méthodes basées sur les données pour la prévision à haute résolution des eaux de surface est indéniable.

SeaCast utilise une architecture d'encodage-traitement-décodage, opérant sur une grille de graphes hiérarchique adaptée aux caractéristiques méditerranéennes. Comme illustré ci-dessous, l'état de l'océan et le champ de forçage atmosphérique sont d'abord encodés dans une représentation de grille multi-échelle à faible résolution. Ensuite, des couches de réseau neuronal de graphes traitent ces caractéristiques latentes de manière hiérarchique, permettant au modèle de capturer efficacement les interactions à courte et longue portée de l'océan. La sortie traitée est ensuite décodée pour retrouver la grille haute résolution d'origine.

SeaCast utilise des réseaux neuronaux graphiques pour la prédiction autorégressive des océans.

Contrairement à la prédiction directe de l'état à l'instant suivant,Le modèle vise à apprendre l'évolution de l'état de l'océan à l'échelle diurne. Il superpose les changements prévus à l'état actuel, puis intègre des conditions aux limites dynamiques pour générer une prévision complète pour l'étape temporelle suivante.Cet état sera utilisé comme nouvelle entrée du modèle, permettant des prévisions à différents moments grâce à une boucle autorégressive. Contrairement aux modèles multi-échelles tels que GraphCast qui connectent les nœuds uniquement au sein d'une même couche de grille, l'approche hiérarchique employée dans cette étude divise la zone de prévision en plusieurs couches de grille indépendantes. Il en résulte une connectivité plus uniforme entre la grille et le graphe, réduisant ainsi efficacement le biais de simulation dû aux différences de taille des voisinages des nœuds.

Le champ de forçage atmosphérique prend pleinement en compte la réponse de l'océan aux conditions atmosphériques, notamment la composante de contrainte du vent à 10 mètres, la température de l'air à 2 mètres, la pression moyenne au niveau de la mer, ainsi que les valeurs sinus et cosinus du nombre de jours cumulés annuels comme indicateurs saisonniers. Lors de la phase d'apprentissage, les conditions prévues pour les zones frontalières de Gibraltar et des Dardanelles sont superposées aux valeurs réelles, tandis que lors de la phase d'évaluation, ces dernières sont remplacées par les données de prévision MedFS afin de gérer les conditions aux limites ouvertes et d'assurer une dynamique plus réaliste des flux d'eau de mer entrants et sortants.

Le modèle SeaCast a d'abord été pré-entraîné pendant 200 itérations à l'aide de 35 ans de données de réanalyse quotidiennes, puis affiné pendant 30 itérations à l'aide de 2 ans de données d'analyse. Le pré-entraînement a été exécuté en parallèle pendant 20,5 heures (1 312 heures GPU) sur 64 GPU AMD MI250x, et l'affinage a été exécuté sur 8 GPU pendant 3,5 heures (28 heures GPU).

Les capacités de prévision de SeaCast sont supérieures à celles du modèle MedFS.

Pour évaluer les performances de prévision du modèle SeaCast, nous avons mené des expériences multidimensionnelles. En utilisant MedFS comme référence, nous avons conçu des expériences contrôlées afin d'évaluer ses capacités de prévision dans des domaines clés tels que l'identification des événements extrêmes de haute température, l'impact du forçage atmosphérique et la durée d'apprentissage.

Dans une expérience comparative entre SeaCast et MedFS, MedFS avait un délai de prévision de 10 jours.SeaCast a réalisé des prévisions océaniques à 15 jours en intégrant les produits atmosphériques de l'ECMWF étendus à 15 jours et en extrapolant les limites latérales.L'expérience a porté sur six facteurs : les courants zonaux, les courants méridiens, la salinité, la température, la température de surface de la mer et l'anomalie du niveau marin. Une validation stratifiée a été mise en œuvre, avec une valeur de référence de persistance comme limite inférieure. Les résultats sont présentés dans la figure ci-dessous.SeaCast surpasse globalement MedFS, et l'écart se creuse à mesure que le délai de prévision augmente.La stratification verticale montre que les avantages de la température et du courant sont les plus prononcés près de la surface de la mer, tandis que l'effet optimal de la salinité est observé dans les eaux plus profondes ; ce n'est qu'à une profondeur de 192 mètres que SeaCast n'a pas surpassé significativement MedFS, ce qui peut être lié au fait que les processus plus profonds n'ont pas été pris en compte.

Variation des erreurs de prédiction dans les modèles SeaCast, MedFS et de référence persistante

Pour identifier les événements extrêmes, les chercheurs se sont appuyés sur la définition des vagues de chaleur océaniques et ont calculé le 90e percentile de la température de surface de la mer à partir de données satellitaires afin de définir un seuil pour les événements de température extrême. Les résultats sont présentés dans la figure ci-dessous.SeaCast et MedFS ont tous deux largement surpassé le critère de référence en matière de persistance en termes de capacités de reconnaissance, SeaCast étant légèrement meilleur.Son délai de prévision de 15 jours offre plus de temps pour une alerte précoce.

Le score HSS est utilisé pour détecter les anomalies de température de surface de la mer supérieures au 90e percentile.

Des chercheurs ont conçu différentes variantes de l'expérience afin d'évaluer l'impact de la période d'entraînement et du réglage fin. Les résultats sont présentés dans la figure ci-dessous. Pour les courants zonaux, les courants méridiens, la température et la température de surface de la mer, le modèle entraîné avec seulement 10 ans de données de réanalyse a obtenu des performances comparables à celles de MedFS ; cependant, les anomalies de salinité et du niveau de la mer ont nécessité 35 ans de données et un réglage fin pour surpasser MedFS. Le réglage fin n'a apporté qu'une amélioration limitée aux anomalies du niveau de la mer, probablement en raison de la rareté des données de validation, mais les versions réglées finement des autres éléments ont surpassé les versions non réglées. Cette observation a des implications pour les régions disposant de données historiques limitées.Avec seulement 10 ans de réanalyse et à moindre coût, il est possible de former des modèles de prédiction d'apprentissage automatique dont les performances sont comparables à celles des modèles numériques.

Différences d'erreur quadratique moyenne normalisée (RMSE) entre la variante SeaCast et MedFS par rapport au modèle de référence à différents délais de prévision.

Prévisions océaniques basées sur l'IA : exploration et pratique par les milieux universitaires et industriels du monde entier

À l'échelle mondiale, les milieux universitaires et industriels collaborent avec une ampleur et une profondeur sans précédent pour promouvoir l'intégration et l'innovation de l'intelligence artificielle et des technologies de prévision marine. Plusieurs résultats de recherche et systèmes opérationnels représentatifs redessinent le paysage technologique de ce domaine.

Parmi eux, le Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT), en tant qu'organisme de référence pour les prévisions météorologiques mondiales à moyen terme, tout en optimisant continuellement son système de prévision numérique traditionnel IFS, a...Ces dernières années, le système de prévision par intelligence artificielle AIFS a été lancé et est entré en phase opérationnelle.Il convient de noter que le CEPMMT étend ce cadre fondé sur les données aux modèles du système terrestre, en se concentrant sur la modélisation par apprentissage automatique de composantes telles que l'océan, la glace de mer et les vagues océaniques.

Parallèlement, l'initiative Earth-2 de NVIDIA illustre les initiatives stratégiques du géant technologique dans le domaine de la simulation climatique et océanique. Earth-2 n'est pas un modèle unique, mais une plateforme technologique complète qui englobe les prévisions météorologiques mondiales, la simulation climatique, la réduction d'échelle par IA générative et l'assimilation de données.L'un de ses composants principaux, FourCastNet, en tant que modèle de prévision mondial précoce basé sur Transformer, a atteint des capacités de prévision comparables aux modèles numériques traditionnels.

Par ailleurs, le modèle NeuralGCM de Google Research constitue une exploration prometteuse des approches de modélisation hybrides. Ce modèle combine un noyau dynamique atmosphérique différentiable avec un schéma de paramétrisation physique sous-maille qui remplace l'apprentissage automatique, permettant ainsi des décennies de simulations climatiques stables.

Cela démontre que l'intelligence artificielle s'intègre progressivement aux aspects fondamentaux de la prévision océanique, dépassant son rôle d'outil auxiliaire. Qu'elle serve de complément aux modèles physiques, d'alternative complète ou d'intégration hybride, la valeur des approches fondées sur les données a dépassé le stade de la vérification théorique et est sur le point d'être explorée opérationnellement et appliquée industriellement. À l'avenir, grâce à l'accumulation continue de données d'observation multimodales et à l'intégration plus poussée de l'IA générative aux mécanismes physiques, la technologie de prévision océanique devrait atteindre un nouvel équilibre entre précision, rapidité et interprétabilité, offrant ainsi une base technologique plus solide pour la recherche scientifique et les applications industrielles.

Liens de référence :
1.https://mp.weixin.qq.com/s/dlEDxumoeTCkfkgY2s7V2g
2.https://mp.weixin.qq.com/s/dqhe6tWYrYvh06HTepsFpw