FourCastNet3 : une avancée majeure dans la prévision météo à grande échelle avec une précision et une vitesse inégalées
FourCastNet3 (FCN3), le dernier système de prévision météorologique global développé par NVIDIA Earth-2, offre une combinaison inédite de précision probabiliste, d’efficacité computationnelle, de fidélité spectrale, de calibration des ensembles et de stabilité à des échéances submensuelles. Ce modèle dépasse la précision des systèmes de prévision numériques traditionnels, comme IFS-ENS, et rivalise avec les modèles d’apprentissage automatique les plus avancés, tels que GenCast. Un lancement de 60 jours avec une résolution de 0,25° et toutes les 6 heures est calculé en moins de quatre minutes sur une seule carte graphique NVIDIA H100, soit un gain de vitesse de 8 fois par rapport à GenCast et de 60 fois par rapport à IFS-ENS. L’architecture de FCN3 repose sur un opérateur neuronal convolutif sur une sphère, qui transforme les variables atmosphériques et de surface à partir d’un pas de temps à un autre. Contrairement à FourCastNet2, qui utilise des opérateurs de Fourier, FCN3 intègre des convolutions locales et spectrales, paramétrées à l’aide de ondelettes de Morlet. Cette approche permet de créer des filtres anisotropes adaptés aux phénomènes atmosphériques locaux, tout en assurant une efficacité computationnelle élevée grâce à une implémentation personnalisée en CUDA. FCN3 introduit une stochasticité à chaque étape de prévision à l’aide d’une variable de bruit latente, dont l’évolution est guidée par un processus de diffusion sur la sphère. Cette formulation de type modèle de Markov caché permet une génération rapide d’ensembles, contrairement aux approches basées sur les modèles de diffusion. Le modèle est entraîné en tant qu’ensemble, en minimisant une fonction de perte combinée qui intègre le score de probabilité continue (CRPS) dans l’espace et dans le domaine spectral. Cela assure une bonne prise en compte des corrélations spatiales dans les processus atmosphériques stochastiques. Pour échelonner le modèle, NVIDIA a adopté une approche innovante inspirée de la décomposition de domaine utilisée dans les modèles numériques traditionnels. Cela permet de charger des modèles plus grands dans la mémoire VRAM pendant l’entraînement, tout en réduisant le débit d’entrée/sortie disque par appareil. Les opérations spatiales, comme les convolutions, sont implémentées de manière distribuée à l’aide de la bibliothèque NCCL. FCN3 peut ainsi être entraîné sur jusqu’à 1 024 GPUs, en utilisant une parallélisation simultanée du domaine, des lots et des ensembles. Les ensembles probabilistes de FCN3 montrent des rapports de dispersion et de compétence proches de 1, ce qui indique une bonne calibration des prévisions. Les histogrammes de rang et les diagnostics supplémentaires confirment que les membres de l’ensemble restent interchangeables avec les observations réelles, assurant ainsi la fiabilité des prédictions. De plus, FCN3 préserve les signatures spectrales de l’atmosphère à tous les échelles, reproduisant fidèlement la cascade d’énergie et la netteté des modèles météorologiques réels, même à des échéances de 60 jours. En septembre 2024, FCN3 a été utilisé pour prédire le passage de la tempête Dennis sur l’Europe. Les prédictions ont bien capté l’intensité et la variabilité des vents, illustrées par une densité spectrale angulaire fidèle. Cette performance est confirmée par les résultats obtenus à 96 heures d’avance, montrant une bonne précision des champs de vapeur d’eau et des vents à 10 mètres. Pour commencer à utiliser FCN3, le point de contrôle entraîné est disponible sur NVIDIA NGC. Une méthode simple consiste à utiliser Earth2Studio, qui permet d’exécuter des inférences d’ensembles en quelques lignes de code. NVIDIA recommande l’installation de torch-harmonics avec des extensions CUDA personnalisées et l’utilisation de la précision mixte automatique en format bf16 pour optimiser les performances. En tant que modèle avancé, FCN3 représente une évolution majeure dans la prévision météorologique basée sur les données, avec une capacité à produire des prédictions fiables sur des échéances allant de moyenne à submensuelle. Les experts du secteur soulignent son potentiel pour améliorer la précision et la rapidité des systèmes de prévision, tout en offrant une alternative efficace aux méthodes traditionnelles.
