HyperAI

En Intégrant Le Supercalcul Et L'informatique Intelligente, L'équipe De L'académie Chinoise Des Sciences a Construit Un Modèle De Prévision De Puissance Photovoltaïque À Plusieurs Échelles De Temps Pouvant Intégrer Des Données Météorologiques.

特色图像

Lors de la 20e Conférence académique annuelle nationale sur le calcul haute performance du CCF (CCF HPC China 2024) - Forum sur les technologies de fusion de supercalcul intelligent dans les applications d'ingénierie de simulation numérique,Wan Meng, ingénieur du département d'intelligence artificielle du centre d'information sur les réseaux informatiques de l'Académie chinoise des sciences, a partagé les applications pratiques et les méthodologies accumulées par l'équipe dans la production d'énergie photovoltaïque et la charge électrique, ainsi que les tendances de recherche de pointe en matière d'apprentissage profond dans le domaine de la prédiction des séries chronologiques, fournissant de nouvelles idées et méthodes techniques pour la prédiction de nouvelles énergies.

HyperAI a compilé et résumé ce partage approfondi sans violer l'intention initiale.Il est divisé en quatre parties : séries chronologiques, aperçu du contexte énergétique, base de recherche et progrès de la recherche.Voici la transcription du discours.

Les séries chronologiques ont une large gamme d’applications, couvrant de nombreux aspects

Les séries chronologiques que nous étudions visent à faire des prédictions et des jugements scientifiques sur les tendances de développement ou les états futurs d’objets spécifiques.Dans notre vie réelle, les séries chronologiques sont largement utilisées, couvrant de nombreux aspects tels que la circulation, l’économie financière, la météorologie, la transmission des virus et l’énergie.

Les axes de recherche actuels sur les séries chronologiques sont principalement divisés en quatre parties.La première partie concerne la prédiction future des séries chronologiques,Nous pouvons prédire les séquences futures en fonction de nos séquences historiques connues, notamment les prévisions photovoltaïques, les prévisions météorologiques, les prévisions boursières, etc.La deuxième partie consiste à combler les lacunes des séries chronologiques.Cela comprend la surveillance de l'opinion publique, la défaillance des capteurs, la maintenance des équipements industriels, etc. Par exemple, une défaillance des capteurs dans les scénarios industriels peut entraîner la perte de certaines données d'exploitation.La troisième partie est la détection d'anomalies de séries temporelles (trafic anormal de séries temporelles).Il s’agit également d’un phénomène très courant dans le trafic réseau, comme les attaques réseau anormales, la surveillance d’un environnement anormal et l’identification des fraudes financières.La partie 4 concerne la classification des séries chronologiques.Par exemple, la classification des électrocardiogrammes, la classification de la parole et la surveillance des tremblements de terre en médecine.

Ensuite, nous explorerons les différences significatives entre les séries chronologiques et les séries en langage traditionnel. Les séquences de langage humain sont généralement constituées de phrases, qui sont des représentations discrètes à haute densité sémantique. En revanche,Les séries temporelles sont principalement composées de signaux naturels, qui peuvent contenir des points numériques continus et leur principale caractéristique est une densité sémantique relativement faible.

La contradiction entre la difficulté d’absorber l’électricité pendant la pause déjeuner et la pénurie d’électricité pendant la pointe du soir est flagrante, et les nouvelles prévisions énergétiques sont confrontées à trois défis majeurs.

Lorsque je discuterai de la manière de résoudre ce problème, je me concentrerai sur les progrès de recherche de notre équipe dans le sens des séries chronologiques de nouvelles énergies, en particulier la prédiction de la production d'énergie photovoltaïque.


Étant donné que la production d’énergie photovoltaïque présente les caractéristiques d’une production d’énergie importante à midi et d’une production quasi nulle la nuit, elle augmente la difficulté de réguler l’ensemble du système électrique. Surtout l'après-midi, il devient plus difficile d'absorber de l'énergie nouvelle, et l'alimentation électrique pendant la période de pointe du soir est également confrontée à des tensions. Cette contradiction est particulièrement frappante. Par conséquent, la demande de prévisions précises de production d’énergie photovoltaïque est sans précédent pour la formulation de plans de production d’énergie à un jour, l’ajustement des bilans énergétiques intrajournaliers et le fonctionnement du marché de l’énergie.

Aperçu du contexte actuel de la production d'énergie photovoltaïque

Cependant, il existe actuellement trois défis majeurs dans la prévision des nouvelles énergies.Premièrement, les prévisions météorologiques numériques ne répondent pas actuellement aux besoins de prévisions de haute précision pour les centrales photovoltaïques ; deuxièmement, les modèles de centrales photovoltaïques centralisées ne suffisent pas à décrire les fluctuations de puissance et sont difficiles à adapter aux besoins de prévision dans des conditions temporelles et météorologiques multiples ; troisièmement, les centrales photovoltaïques distribuées manquent de données sur l’irradiance du sol et la distribution des caractéristiques temporelles et spatiales est insuffisante, ce qui rend impossible la réalisation de prévisions à plusieurs échelles de temps.

Construction d'un modèle de prédiction de puissance à plusieurs échelles de temps pour les centrales photovoltaïques centralisées et les centrales photovoltaïques distribuées

Face à une série de défis, nous avons proposé un certain nombre de plans de recherche de modèles pour construire un modèle de prévision de puissance à plusieurs échelles de temps pour les centrales photovoltaïques centralisées et le photovoltaïque distribué.Nous avons d’abord collecté des données météorologiques à partir de plusieurs sources, couvrant des données de différentes échelles de temps et de différents types météorologiques,Y compris des images satellites de nuages, des données de prévisions météorologiques numériques, des données de mesure au sol et des données de mesure de centrales photovoltaïques.


Deuxièmement, sur la base de ces données, nous avons construit un modèle de prédiction d’irradiance sur la couche précédente.Utilisé pour guider les prévisions à très court terme pour les centrales photovoltaïques centralisées et distribuées.Sur cette base, nous avons construit des modèles de prévision pour des échelles de temps à très court terme, à moyen terme, à court terme et autres. Enfin, nous avons construit une plateforme de prévision à temps plein.

Diagramme du cadre général des idées de recherche

Données météorologiques multi-sources

Dans un premier temps, le modèle de prédiction à ultra-court terme de l’irradiance solaire de surface pour les centrales photovoltaïques est développé.Le principal problème actuel est que les prévisions météorologiques numériques sont généralement mises à jour toutes les 12 heures et que leur résolution spatiale et leur précision sont faibles, ce qui rend difficile de répondre aux exigences de résolution spatiale et temporelle des prévisions des centrales photovoltaïques.

Pour résoudre ce problème,Nous avons combiné des images de nuages du satellite Himawari-8 avec des données de prévisions météorologiques numériques.L'image nuageuse de Sunflower-8 a une résolution spatiale de 4 km*4 km et une résolution temporelle de 10 minutes, mais il y a un délai de 20 minutes. La résolution temporelle des prévisions météorologiques numériques est de 15 minutes, la résolution spatiale est de 9 km*9 km et la fréquence de mise à jour est d'une fois toutes les 12 heures.

Itinéraire technique du modèle de prévision à ultra-court terme de l'irradiance solaire de surface pour les centrales photovoltaïques

Modèle de prédiction de la radiosité

Face à ces différences, nous avons développé un modèle de prévision à ultra-court terme et utilisé diverses méthodes d’interpolation pour aligner en parallèle des données météorologiques multi-sources afin de résoudre le problème du retard des données.En utilisant la méthode de prédiction de l'irradiance à ondes courtes de surface basée sur Res-UNet et l'interpolation bilinéaire, nous avons réduit le MAE et le RMSE des prédictions d'une moyenne de 31,31% et 22,18% respectivement dans diverses conditions météorologiques. La figure en bas à droite montre un cas réel de la station CDI de Donghuang dans le comté de Shexian, province du Hebei. Les résultats montrent que Res-UNet peut prédire avec plus de précision la gigue et la valeur de crête de l'irradiance que NWP et UNet.

Architecture du modèle de prédiction à ultra-court terme et étude de cas de l'irradiance solaire de surface des centrales photovoltaïques

Modèle de prévision de la puissance photovoltaïque

Les problèmes du modèle de prévision à très court terme pour les centrales photovoltaïques centralisées résident principalement dans sa forte dépendance aux prévisions météorologiques numériques et dans son manque de précision.Pour résoudre ce problème, nous proposons une méthode centralisée de prédiction de puissance photovoltaïque à ultra-court terme basée sur des convertisseurs à double codage.La combinaison des données d'observation au sol avec les données caractéristiques de l'évolution des nuages dans les images satellites de nuages brise la limitation de la prévision photovoltaïque reposant uniquement sur des données de prévisions météorologiques numériques.

Réseau fédérateur d'extraction de caractéristiques d'images cloud UNet et transformateur de codage double de fusion de données multi-sources

En termes de prévision de la puissance à court terme des centrales photovoltaïques centralisées, l’erreur de prédiction d’un seul modèle est importante et est facilement affectée par des événements météorologiques soudains.À cette fin, nous avons proposé une méthode centralisée de prédiction de puissance photovoltaïque à court terme basée sur un réseau de mémoire à court terme à temps partagé.L'utilisation complète de données météorologiques historiques telles que l'irradiance, la température ambiante, l'humidité et les caractéristiques de corrélation temporelle de la production d'énergie photovoltaïque résout le problème selon lequel un modèle de prévision unique est difficile à adapter à des conditions météorologiques complexes et changeantes, et améliore efficacement la précision de la prévision dans des conditions météorologiques complexes.

Itinéraire technique du modèle de prévision à court terme pour les centrales photovoltaïques centralisées

Pour les prévisions à moyen et long terme, le principal défi est de savoir comment saisir les changements de tendance saisonniers, cycliques et à long terme de la production d’énergie photovoltaïque.Pour résoudre ce problème, nous proposons une méthode centralisée de prévision de la puissance photovoltaïque à moyen terme basée sur un encodeur à double attention, qui utilise de manière exhaustive des données caractéristiques météorologiques périodiques, saisonnières et de tendance.Il permet une capture précise des différentes saisons et des caractéristiques multi-temporelles continues, et est le premier à réaliser l'extraction automatique des cycles et des tendances des séries chronologiques. Les résultats pertinents ont été publiés lors de la conférence AAAI.
Adresse du document :
https://ojs.aaai.org/index.php/AAAI/article/view/25845

Méthode de prévision de puissance à moyen terme basée sur l'attention parallèle interactive et la saisonnalité évolutive, décomposition des tendances

Les principaux problèmes des modèles de prévision à temps plein pour les centrales photovoltaïques distribuées sont leur petite échelle, leur large distribution et le manque de données d’observation météorologique précises sur site. Les modèles de prédiction actuels ne prennent pas pleinement en compte la fusion spatio-temporelle des données multi-sources, ce qui entraîne une précision insuffisante.À cette fin, nous avons proposé des modèles de prédiction de puissance de centrales photovoltaïques distribuées respectivement à ultra-court terme, court terme et moyen terme.


Nous avons également proposé un mécanisme d’attention graphique multicouche,Extraire automatiquement la corrélation spatiotemporelle entre les centrales photovoltaïques massives distribuées et les données météorologiques mesurées et les images de nuages satellites des centrales photovoltaïques centralisées environnantes ;Un modèle de prédiction de puissance photovoltaïque distribuée à court terme basé sur un réseau à double attention est proposé.Grâce au mécanisme d'attention intra-station et inter-station, les données de prévision météorologique numérique des centrales électriques distribuées et les données de mesure au sol des centrales photovoltaïques centralisées sont intégrées pour réaliser la fusion des caractéristiques spatiales géographiques dans le modèle de prédiction ;Une méthode de prévision de puissance photovoltaïque distribuée à moyen terme basée sur un mécanisme d'attention multicouche géo-conscient est proposée.Les centrales photovoltaïques centralisées fortement corrélées sont examinées par une analyse de corrélation grise, et le mécanisme d'attention fine à plusieurs niveaux inter-stations et intra-stations est adopté pour extraire automatiquement la corrélation spatio-temporelle entre les caractéristiques météorologiques des centrales photovoltaïques centralisées et la puissance des centrales photovoltaïques distribuées.

Itinéraire technique du modèle de prédiction à temps plein pour les centrales photovoltaïques distribuées


Plateforme complète

Enfin, nous avons développé une plate-forme de système de surveillance, de prévision et de contrôle des ressources d'irradiance provinciales et de la production d'énergie photovoltaïque avec des niveaux de tension complets et plusieurs échelles de temps, y compris un module de fonction de surveillance des données de ressources et d'exploitation photovoltaïques, un module de fonction de prédiction à échelle de temps complète photovoltaïque centralisé, un module de fonction de prédiction à échelle de temps complète photovoltaïque distribué et un module de fonction de contrôle intégré photovoltaïque.
* Module de fonction de surveillance des données de ressources et d'exploitation photovoltaïques : réalise la mesure et l'affichage des données météorologiques et la surveillance panoramique des centrales photovoltaïques centralisées et des centrales photovoltaïques distribuées basse tension massives.
* Module de fonction de prédiction centralisée à l'échelle photovoltaïque à temps plein : réalise la surveillance en temps réel, l'avertissement anormal, l'auto-apprentissage du modèle, etc. de l'échelle photovoltaïque à temps plein.
* Module de fonction de prédiction à l'échelle du temps plein photovoltaïque distribué : réalise la gestion des données NWP, les données mesurées de la station photovoltaïque, la gestion des données de base, la prédiction de puissance régionale, la prédiction de puissance de la station photovoltaïque, la gestion du système et d'autres fonctions.
* Module de fonction de contrôle intégré photovoltaïque : réalise une surveillance complète des données et une planification d'optimisation coordonnée, combine une prédiction centralisée et distribuée, un réglage et une optimisation automatiques, une détection d'anomalies et une alarme, pour assurer un fonctionnement sûr et stable du réseau électrique et une consommation élevée de nouvelle énergie.

Plateforme de système de surveillance, de prévision et de contrôle des ressources d'irradiance provinciales et de la production d'énergie photovoltaïque pour tous les niveaux de tension et plusieurs échelles de temps

Deux avancées majeures dans les séries chronologiques dans le domaine des énergies non nouvelles

Ensuite, je présenterai principalement les progrès des travaux sur les séries chronologiques dans les domaines énergétiques non nouveaux.D'une part, nous avons proposé un cadre général de compression sans perte basé sur l'amélioration sémantique et le pipeline multi-flux, qui comprend principalement trois contenus de recherche : l'amélioration sémantique du flux d'octets, l'accélération du pipeline multi-flux et l'optimisation de la mémoire vidéo.

En termes d'amélioration sémantique du flux d'octets, nous avons développé une série de nouvelles méthodes pour obtenir des informations sémantiques complexes, notamment la fusion des dimensions des patchs et les techniques de fenêtre coulissante adaptative.


En termes d'accélération de pipeline multi-flux, nous avons développé un module d'accélération multi-flux pour les moteurs de multi-réplication GPU et un modèle de file d'attente pour les multi-cœurs CPU.

Amélioration de la sémantique du flux d'octets et cadre de pipeline multi-flux

En termes d'optimisation de la mémoire vidéo, nous avons proposé pour la première fois une stratégie d'optimisation de la mémoire vidéo dans des scénarios multi-flux. Plus précisément, nous utilisons d’abord un profileur pour analyser l’ordre des allocations et des désallocations de mémoire afin d’identifier les blocs de mémoire qui peuvent être partagés. Nous nous concentrons sur les quelques blocs de mémoire qui occupent la majeure partie de la mémoire pour maximiser la réutilisation de la mémoire.

Sur cette base, nous concevons une stratégie de pool partagé pour gérer les blocs de mémoire partagée entre les flux, et les grands blocs de mémoire continue utilisés par celui-ci sont libérés dans le pool partagé et marqués comme blocs réservés ; le prochain flux bloqué peut accéder à ces blocs réservés en ajustant ses pointeurs vers les adresses de ces blocs. Lorsque S2 demande un nouvel espace mémoire, il recherche les blocs réservés disponibles dans le pool partagé. Si des blocs appropriés sont trouvés, malloc les réutilisera dans le flux suivant, ce qui entraînera des économies de mémoire importantes.

Cadre d'optimisation de la mémoire vidéo

Nos principales réalisations sont :Pour les compresseurs d'apprentissage en profondeur, le taux de compression moyen est supérieur à 3% et la vitesse de compression est améliorée de plus de 35% sur les images, les textes, l'audio, la vidéo et les données mixtes hétérogènes. Associé au compresseur PAC, il atteint le courant SOTA ; la méthode d'amélioration sémantique peut être étendue à des tâches telles que les séries chronologiques pour améliorer encore la précision de la prédiction des séries chronologiques ; L'accélération du pipeline multi-flux peut être étendue à des domaines tels que la compression avec perte pour améliorer la vitesse de compression globale.

Résultats de compression

D'autre part, nous proposons un modèle multi-échelle CSIformer pour les séries temporelles générales.Tout d’abord, nous avons conçu un réseau de partitionnement de patch adaptatif pour adapter automatiquement les hyperparamètres traditionnels en apprenant le point central et les limites gauche et droite. De plus, nous avons également proposé une stratégie Stride adaptative, qui utilise la matrice de masque pour ajuster la foulée des blocs avec différentes densités sémantiques. Enfin, afin d’améliorer la capture et la perception des informations de séquences longues, nous avons également conçu une stratégie de fusion pyramidale pour améliorer les performances du modèle dans les séquences longues.

Modèle multi-échelle CSIformer

En termes de modèles de décomposition de séquences multi-niveaux pour la prévision PV, nous nous concentrons sur l'unité de décomposition en ondelettes (WTDU), l'unité de décomposition de tendance saisonnière (STDU) et l'architecture SEEDTrans.Il est à noter que le modèle améliore la précision de prédiction de plus de 40% par rapport au modèle ARIMA traditionnel dans 6 centrales électriques du Hebei, en Chine.

À propos de Wanmeng

Wan Meng est doctorant à l'Université des sciences et technologies de Pékin et est actuellement ingénieur au département d'intelligence artificielle du Centre d'information sur les réseaux informatiques de l'Académie chinoise des sciences. Il a obtenu sa licence et sa maîtrise en génie logiciel respectivement à l'Université des postes et télécommunications de Pékin et à l'Université de Southampton au Royaume-Uni.

Il est principalement engagé dans la recherche liée à la prévision des séries chronologiques et aux plateformes d'intelligence artificielle, notamment la prédiction du traitement de la production d'énergie photovoltaïque, le calcul et la simulation des matériaux polymères et le cycle écologique du carbone. Il a participé à des projets tels que « Construction d'un pool de ressources logicielles pour le cloud scientifique et technologique en Chine » et « Application innovante de l'intelligence artificielle ».

Adresse e-mail de Wan Meng :[email protected]