Die Columbia University Führt Eine Verbesserte Version Des Neuronalen Netzwerks Org-NN Ein, Um Extreme Niederschläge Präzise Vorherzusagen

Inhalte im Überblick: Da sich die Umweltveränderungen intensivieren, sind in den letzten Jahren weltweit häufig extreme Wetterphänomene aufgetreten. Die genaue Vorhersage der Niederschlagsintensität ist sowohl für den Menschen als auch für die natürliche Umwelt sehr wichtig. Das traditionelle Modell prognostiziert Niederschläge mit einer geringen Varianz, tendiert zu leichter Regenvorhersage und unterschätzt extreme Niederschläge.
Schlüsselwörter: Implizites Lernen neuronaler Netzwerke für extremes Wetter
Dieser Artikel wurde zuerst auf der öffentlichen HyperAI WeChat-Plattform veröffentlicht~
Aufgrund des Taifuns Dusurui kam es in Peking seit dem 29. Juli mehrere Tage in Folge zu heftigen Regenfällen, in einigen Gebieten kam es sogar zu extrem starken Regenfällen. Extrem starke Regenfälle verursachten im Haihe-Flussbecken eine große, beckenweite Überschwemmung, und in Mentougou, Zhuozhou und anderen Orten kam es zu schweren Überschwemmungskatastrophen.
Laut einem Bericht von CCTV.com vom 31. Juli wurden während dieser schweren Regenfälle mehr als 10 Millionen Kubikmeter Wasser aus Peking abgelassen, was der Trockenlegung von etwa fünf Kunming-Seen im Sommerpalast entspricht.Durch eine rechtzeitige, genaue und wirksame Vorhersage extremer Niederschläge können die Zahl der Opfer und die Verluste durch Wetterkatastrophen minimiert werden.
Bei der Parametrisierung herkömmlicher Klimamodelle fehlen Informationen zur Struktur und Organisation von Wolken im Subgittermaßstab. Dies wirkt sich auf die Intensität und Zufälligkeit der Niederschläge bei grobkörniger Auflösung aus und führt dazu, dass extreme Niederschlagsbedingungen nicht genau vorhergesagt werden können.Das LEAP Lab der Columbia University verwendete globale Sturmanalysesimulationen und maschinelles Lernen, um einen neuen Algorithmus zu erstellen, der das Problem fehlender Informationen löst und eine genauere Prognosemethode bietet.
Die Forschungsergebnisse wurden kürzlich in PNAS veröffentlicht und der Titel des Artikels lautet „Implicit learning of convective organization explains rainfall stochasticity“.

Der Artikel wurde in PNAS veröffentlicht
Adresse des Artikels: https://www.pnas.org/doi/10.1073/pnas.2216158120#abstract
Vorbereitung: 10 Tage Wetterdaten + 2 neuronale Netzwerke
Daten und Verarbeitung
Der vom Experimentalteam verwendete Datensatz istDYAMOND (Dynamik der atmosphärischen allgemeinen Zirkulation, modelliert auf nicht-hydrostatischen Domänen) Teil der während des Vergleichsprojekts Phase II simulierten Dynamik der atmosphärischen Zirkulation. Dieses Projekt simulierte 40 Tage Winter auf der Nordhalbkugel. Die Experimentatoren nutzten die ersten 10 Tage als Anlaufphase des Modells und wählten nach dem Zufallsprinzip 10 Tage innerhalb der nächsten 30 Tage als Trainingsdatensatz aus.
Die Forscher wählten geeignete Daten aus.Diese Daten sind grobkörnig und in Unterdomänen mit Rastern unterteilt, die der GCM-Größe entsprechen oder mit dieser vergleichbar sind.
Um Trainings-, Validierungs- und Testdatensätze bereitzustellen, teilte das Team die 10 Tage anschließend in 6 Tage, 2 Tage und 2 Tage für Training, Validierung und Test auf.Es werden nur Proben mit Niederschlagsmengen über dem Schwellenwert (0,05 mm/h) aufbewahrt, sodass wir uns nur auf die Niederschlagsintensität und nicht auf die Niederschlagsursache konzentrieren können. . Schließlich betrug die Gesamtzahl der Proben 108.
Neuronale Netzwerkarchitektur
In ihren Experimenten verwendeten die Forscher zwei neuronale Netzwerke:Das traditionelle Modell Baseline-NN (Baseline Neural Network) und das neu vorgeschlagene Org-NN .
Baseline-NN ist ein vollständig verbundenes Feedforward-Netzwerk mit einer Lernrate, die pro Generation angepasst wird.Als traditionelles Modell kann Baseline-NN nur auf großräumige Variablen zugreifen und Niederschläge vorhersagen.
Org-NN enthält einen Autoencoder, dessen Encoder-Teil drei eindimensionale Faltungsschichten und zwei vollständig verbundene Schichten umfasst.. Die Eingabe für den Encoder ist eine hochauflösende PW-Anomalie (Niederschlagswasser) der Größe 32 x 32, und die Ausgabe ist eine Org-Variable. Die Org-Dimension ist ein Hyperparameter des Netzwerks, den die Forscher auf 4 gesetzt haben. Der Decoder empfängt die Org-Variable und rekonstruiert das ursprüngliche hochauflösende Feld, das die Umkehrung der Struktur des Encoders darstellt. Der neuronale Netzwerkteil von Org-NN ähnelt Baseline-NN, verfügt jedoch zusätzlich über eine organisatorische latente Variable (org) als Eingabe. .
Beide wurden mit TensorFlow Version 2.9 implementiert und die Hyperparameter wurden mit der Sherpa-Optimierungsbibliothek abgestimmt.
Experimentelle Ergebnisse
Das Versuchsteam hat zwei Modelle vorab trainiert.Um die Vorhersageleistung des neuronalen Netzwerks zu bewerten, wählten die Forscher R2, eine Metrik, die häufig zur Quantifizierung der Leistung von Regressionsmodellen verwendet wird.. Die Berechnungsformel lautet wie folgt:

Traditionelles Modell Baseline-NN
Das Versuchsteam verwendete zunächst Baseline-NN.Die folgende Abbildung zeigt die Niederschlagsvorhersage bei Verwendung von grobkörnigen PW-, SST-, qv2m- und T2m-Daten als Eingabe.. Unter ihnen werden qv2m und T2m verwendet, um Baseline-NN Informationen zum Grenzschichtzustand bereitzustellen. Das Versuchsteam teilte die grobkörnigen Niederschlagsmengen in Gruppen ein und berechnete den Durchschnitt der vorhergesagten und tatsächlichen Werte der grobkörnigen Niederschläge in jeder Gruppe.Außerdem wurde die Varianz der grobkörnigen Niederschlagswerte innerhalb jeder Gruppe berechnet..
PW: Niederschlagswasser
SST:Meeresoberflächentemperatur, Meeresoberflächentemperatur
qv2: bodennahe spezifische Luftfeuchtigkeit
T2m:Luftfeuchtigkeit 2m über der Oberfläche, Oberflächentemperatur

Abbildung 1: Durchschnittswert des grobkörnigen Niederschlags auf dem PW-Behälter
gepunktete Linie: Der tatsächliche durchschnittliche Niederschlag
Orange Linie: Vorhergesagter Niederschlagsdurchschnitt
Grüne Linie: R2 wird in jedem PW-Bin berechnet
Schatten: Varianz innerhalb jeder Gruppe
Baseline-NN stellt die wichtigsten Verhaltensweisen des Niederschlagsmittelwerts (d. h. des Durchschnitts der Gruppen) unter PW-Bedingungen sowie die schnellen Übergänge, die in der Nähe der kritischen Punkte auftreten, genau wieder her. Aber,Das experimentelle Team stellte fest, dass es die in globalen Sturmsimulationen beobachtete Niederschlagsvariabilität nicht erklären konnte, und seine Leistung (gemessen am R2-Wert aller Proben) beträgt etwa 0,45. Ein niedriger R2-Wert zeigt an, dassObwohl eine gewisse Niederschlagsvariabilität erfasst werden kann, lässt sich keine starke Beziehung zwischen Eintrag und Niederschlag feststellen., und der für jeden PW-Behälter berechnete R2-Wert überschritt 0,5 nicht.
Gleichzeitig verglich das Versuchsteam auch die Wahrscheinlichkeitsdichtefunktion des von Baseline-NN vorhergesagten Niederschlags mit dem tatsächlichen Niederschlag.Dies zeigt, dass das Modell das Ende der Niederschlagsverteilung nicht vorhersagen kann, d. h., es kann keine extremen Niederschläge vorhersagen..

Abbildung 2: Schematische Darstellung der Wahrscheinlichkeitsdichtefunktion von Niederschlägen
Blauer Teil: Wahrscheinlichkeitsdichtefunktion des tatsächlichen Niederschlags
Orangefarbener Teil: Entsprechend der Wahrscheinlichkeitsdichtefunktion des vorhergesagten Niederschlags
Die Forscher verwendeten außerdem die gesamte Wolkendecke auf grobkörniger Ebene als einen der Inputs für das neuronale Netzwerk, um das Baseline-NN weiter zu testen.. Die gesamte Wolkenbedeckung ist eine parametrisierte Variable in Klimamodellen und steht in keinem direkten Zusammenhang mit dem Niederschlag. Daher kann ihre Verwendung als Eingabe für das neuronale Netzwerk Hinweise auf die Kondensation liefern, die wiederum direkt zur Parametrisierung des Niederschlags verwendet werden. Dies verbessert die Vorhersage zwar nur geringfügig, zeigt aber, dass die durchschnittliche Wolkendecke keine relevanten Informationen für eine genaue Niederschlagsvorhersage liefert. Darüber hinaus führte das Versuchsteam weitere Analysen durch.Es wurde bestätigt, dass CAPE und CIN nicht als Prädiktoren verwendet werden können und die Vorhersageergebnisse nicht verbessern können..

Abbildung 3: Niederschlagswahrscheinlichkeitsdichtefunktion
Blauer Teil: Wahre Niederschlagswahrscheinlichkeitsdichtefunktion
Orangefarbener Teil: Vorhersage der Niederschlagswahrscheinlichkeitsdichtefunktion
A: Eingabe ist [PW, SST, qv2m, T2m, fühlbarer Wärmefluss, latenter Wärmefluss]
B: Eingabe ist [PW, SST, qv2m, T2m, Gesamtwolkenbedeckung]
C: Eingabe ist [PW, SST, qv2m, T2m, CAPE, CIN]
Die Schlussfolgerung ist, dass Baseline-NN Niederschlag und Variabilität nur unzureichend genau vorhersagen kann..
Neues Modell Org-NN
Das Versuchsteam änderte dann die traditionelle Methode und verwendete Org-NN zur Vorhersage. Da Org-NN einen Autoencoder enthält, kann es durch Backpropagation direkt Feedback von der Zielfunktion des neuronalen Netzwerks erhalten.Daher kann der Autoencoder passiv relevante Informationen extrahieren, um Niederschlagsvorhersagen zu verbessern.
Die folgende Abbildung zeigt die Niederschlagsvorhersageergebnisse von Org-NN mit grobkörnigen Variablen und org als Eingabe. Im Vergleich zu Baseline-NN hat Org-NN erhebliche Fortschritte gemacht. Bei Berechnung über alle Datenpunkte erhöht sich der prognostizierte R2-Wert auf 0,9. Für jedes PW-Intervall, mit Ausnahme des Intervalls mit geringerem Niederschlag, liegen die berechneten R2-Werte fast nahe bei 0,80.

Abbildung 4: Org-NN-Vorhersageergebnisse
D: Durchschnittswert des grobkörnigen Niederschlags auf dem PW-Behälter
E:Schematische Darstellung der Wahrscheinlichkeitsdichtefunktion des Niederschlags
F: R2-Werte, die über den Zeitschritt für jeden Breiten- und Längengradstandort in Abbildung D berechnet wurden. Die weißen Bereiche in der Abbildung zeigen Niederschlagsmengen von weniger als 0,05 mm/h an und sind von der Modelleingabe ausgeschlossen. Mit Ausnahme der Gebiete in der Nähe der Punkte, die die Niederschlagsschwelle nicht erreichten, lagen die R2-Werte von Org-NN in den meisten Gebieten deutlich über 0,8.
Das Versuchsteam verglich die Wahrscheinlichkeitsdichtefunktionen des realen Niederschlags von Org-NN und hochauflösenden Niederschlagsmodellen, um die Leistung von Org-NN weiter zu quantifizieren. Es wurde festgestellt, dass Org-NN die Wahrscheinlichkeitsdichtefunktion vollständig erfasst, einschließlich des Endes ihrer Verteilung, das den extremen Niederschlägen entspricht.Dies zeigt, dass Org-NN extreme Niederschläge genau vorhersagen kann..
Die vom Versuchsteam erzielten Ergebnisse zeigen, dass sich Niederschlagsvorhersagen durch die Einbeziehung von org in die Eingabe deutlich verbessern. Dies deutet darauf hin, dass die Struktur unterhalb des Gittermaßstabs wichtige fehlende Informationen bei der Parametrisierung von Konvektion und Niederschlag in aktuellen Klimamodellen sein könnte..
Zusammenfassung des experimentellen Prozesses

Abbildung 5: Übersicht über den Versuchsablauf
A:Datenverarbeitungsprozess: grobkörnige hochauflösende Daten
B: Baseline-NN: Dieses Netzwerk empfängt grobe Variablen (wie SST und PW) als Eingabe und sagt grobe Niederschläge voraus.
C:Org-NN: Die linke Abbildung zeigt den Autoencoder, der das hochauflösende PW als Eingabe erhält und es nach dem Durchlaufen des Flaschenhalses rekonstruiert. Die Abbildung rechts zeigt ein neuronales Netzwerk, das Niederschläge im großen Maßstab vorhersagt.
Traditionelle Klimamodelle stehen vor einer Veränderung
Das Team für dieses Experiment kam aus Die Erde mit künstlicher Intelligenz und Physik kennenlernen (LEAP), ein NSF-Wissenschafts- und Technologiezentrum, das 2021 von der Columbia University gegründet wurde,Die wichtigste Forschungsstrategie besteht darin, physikalische Modellierung und maschinelles Lernen zu kombinieren. Dabei wird Fachwissen aus Klimawissenschaft und Klimasimulation mit modernsten Algorithmen des maschinellen Lernens kombiniert, um kurzfristige Klimavorhersagen zu verbessern.. Davon werden sowohl die Klimawissenschaft als auch die Datenwissenschaft profitieren.

Kurze Vorstellung einiger Mitglieder des LEAP Lab
|Offizielle Website des Labors: https://leap.columbia.edu
Derzeit wenden die Forscher ihren Ansatz des maschinellen Lernens auf Klimamodelle an.Verbesserung der Vorhersagen der Niederschlagsintensität und -variabilität und Ermöglichung genauerer Vorhersagen von Veränderungen im Wasserkreislauf und extremen Wettermustern im Zusammenhang mit der globalen Erwärmung.
Gleichzeitig eröffnet diese Studie auch neue Forschungsrichtungen, beispielsweise die Untersuchung der Möglichkeit, dass Niederschläge einen Memory-Effekt haben, d. h., die Atmosphäre speichert Informationen über die jüngsten Wetterbedingungen, was wiederum die nachfolgenden atmosphärischen Bedingungen beeinflusst. Die neue Methode könnte über Niederschlagssimulationen hinaus breite Anwendung finden, beispielsweise für bessere Simulationen von Eisdecken und Meeresoberflächen.
Dieser Artikel wurde zuerst auf der öffentlichen HyperAI WeChat-Plattform veröffentlicht~