PreDiff : Prédiction immédiate de précipitations basée sur des modèles de diffusion latente

La prévision du système terrestre s’est traditionnellement appuyée sur des modèles physiques complexes, coûteux en termes de calcul et nécessitant une expertise domainale importante. Au cours de la dernière décennie, l’augmentation sans précédent des données d’observation spatio-temporelles de la Terre a permis le développement de modèles de prévision fondés sur les données, utilisant des techniques d’apprentissage profond. Ces modèles se sont révélés prometteurs pour diverses tâches de prévision du système terrestre, mais ils peinent soit à gérer l’incertitude, soit à intégrer les connaissances a priori spécifiques au domaine, ce qui conduit à des prévisions moyennées, floues, ou à des prédictions physiquement invraisemblables. Pour remédier à ces limites, nous proposons une architecture en deux étapes pour la prévision probabiliste spatio-temporelle : 1) nous développons PreDiff, un modèle de diffusion latente conditionnel capable de produire des prévisions probabilistes ; 2) nous intégrons un mécanisme explicite d’alignement avec les connaissances, afin d’assurer que les prévisions respectent les contraintes physiques propres au domaine. Cela est réalisé en estimant, à chaque étape de débruitage, l’écart par rapport aux contraintes imposées, puis en ajustant la distribution de transition en conséquence. Nous menons des études empiriques sur deux jeux de données : N-body MNIST, un jeu de données synthétique présentant un comportement chaotique, et SEVIR, un jeu de données réelles de prévision à court terme de précipitations. Plus précisément, nous imposons la loi de conservation de l’énergie dans N-body MNIST et la prévision de l’intensité des précipitations dans SEVIR. Les expériences démontrent l’efficacité de PreDiff pour gérer l’incertitude, intégrer des connaissances a priori spécifiques au domaine, et générer des prévisions présentant une haute utilité opérationnelle.