HyperAI

Die Colorado State University Veröffentlicht Das CSU-MLP-Modell Zur Vorhersage Mittelfristiger Unwetter Mithilfe Des Random-Forest-Algorithmus

特色图像

Wettervorhersagen, insbesondere Unwettervorhersagen, haben erhebliche Auswirkungen auf die tägliche Arbeit und das Leben der Menschen. Der Sigma-Forschungsbericht „Naturkatastrophen in Zeiten wirtschaftlicher Akkumulation und Klimawandel“ zeigt, dass die weltweiten Schäden durch Unwetter in den letzten Jahren weiter zugenommen haben. Allein im Jahr 2019Die weltweiten wirtschaftlichen Schäden durch die damit verbundenen Katastrophenereignisse beliefen sich auf 146 Milliarden US-Dollar, die Versicherungsschäden beliefen sich auf 60 Milliarden US-Dollar.Der Bericht stellte außerdem fest, dass die Schäden durch Unwetterkatastrophen in Zukunft noch größer werden, da sie immer verheerender werden. Daher ist es besonders wichtig, Unwetter präzise vorherzusagen.

Kürzlich haben Aaron J. Hill und Russ S. Schumacher von der Colorado State University und Israel Jirak vom Storm Prediction Center (SPC) der National Oceanic and Atmospheric Administration (NOAA) gemeinsam ein auf Random Forests basierendes maschinelles Lernmodell namens CSU-MLP entwickelt.Das Modell ist in der Lage, Unwetter mittelfristig (4–8 Tage) genau vorherzusagen.Die Ergebnisse wurden in der Zeitschrift Weather and Forecasting veröffentlicht.

Die Ergebnisse wurden in Weather and Forecasting veröffentlicht.

Papieradresse:

https://arxiv.org/abs/2208.02383

 CSU-MLP Übersicht

Unwettervorhersagen werden in den USA im Allgemeinen vom oben genannten SPC mithilfe des Modells der numerischen Wettervorhersage (NWP) erstellt, das 1–2 Tage im Voraus vor bestimmten Unwettern und dem Ort ihres Auftretens warnen kann.Allerdings können wir 3–8 Tage im Voraus nur den Ort warnen, an dem das Unwetter auftreten wird, aber nicht vorhersagen, um welche Art von Unwetter es sich handeln wird.

Im letzten Jahrzehnt ist ein hochauflösendes numerisches Wettervorhersagemodell entstanden, das CAMs (Convection-Allowing Models). Prognosen in einem Zeitraum von weniger als 4 Tagen (kurzfristig) sind genauer geworden, für mittel- und langfristige Zeiträume hat sich die Vorhersagewirkung jedoch nicht signifikant verbessert. In diesem ZusammenhangMaschinelles Lernen wird zunehmend im Bereich der Meteorologie eingesetzt.

In dieser CSU-MLP-Studie (Colorado State University Machine Learning Probabilities) stammten die meteorologischen Daten für das Modelltraining aus dem Reforecast-Datensatz des Global Ensemble Forecast System Version 12 (GEFSv12) (im Folgenden als GEFS/R bezeichnet), der 20 Jahre detaillierte historische Wetterdaten für die kontinentalen Vereinigten Staaten enthält.Die Forscher wählten Daten aus neun Jahren (2003–2012) als Trainingssatz für diese mittelfristige Prognosestudie.Als Testdaten wurden zwei Jahre (2020–2022) ausgewählt.

 Random-Forest-Algorithmus 

Diese Studie basiert auf einem maschinellen Lernalgorithmus namens Random Forest (RF).Der sogenannte Random Forest ist ein Klassifikations- und Regressionsalgorithmus, der auf Ensemble-Lernen basiert.Insbesondere werden in dieser Studie die Unwettermerkmale eingegeben und der gesamte Entscheidungsbaum durchlaufen, um die Ergebnisse der Unwettervorhersage zu erhalten.

Daher ist der Merkmalsinput „schlechtes Wetter“ im Random-Forest-Algorithmus besonders wichtig.Für das Training extrahierten die Forscher aus dem oben genannten Trainingsset 12 Merkmalsvariablen im Zusammenhang mit Unwettern.Die konkreten Kenngrößen sind in der folgenden Tabelle aufgeführt.

12 Merkmalsvariablen für Modelltraining und Vorhersage

Da die Auflösung dieser charakteristischen Variablen im GEFS/R-Datensatz jedoch nicht konsistent ist, führten die Forscher eine Interpolationsverarbeitung durch.Es wurde auf einen Rasterabstand von 0,5 Grad (Grad-Rasterabstand) vereinheitlicht.

 Feature-Engineering 

Neben der Verwendung von Random Forests für die Analyse mittelfristiger Unwettervorhersagen wurde in dieser Studie auch das Feature Engineering kurz untersucht. Unter Feature Engineering versteht man eine Datenverarbeitungstechnik, mit der Features aus beobachteten Ereignissen gesammelt und in eine Form umgewandelt werden, die von Algorithmen des maschinellen Lernens verwendet werden kann. Insbesondere in diesem Experiment schlugen die Forscher hauptsächlich zwei Methoden zur Vereinfachung von Merkmalen vor.Einschließlich räumlicher Mittelung der Merkmale und Zeitverzögerung.

Beim räumlichen Mitteln ermitteln die Forscher den Durchschnittswert aller charakteristischen Variablen an jedem Vorhersageraumpunkt.AlsoDie Störungen durch verrauschte Daten können reduziert werden, um die Modellleistung zu verbessern.Der konkrete Vorgang ist in der folgenden Abbildung dargestellt.

Verarbeitungsmethode für Merkmalsvariablenkombinationen

Die Time-Lag-Methode bezeichnet den Prozess der Prognose bzw. Modellierung.Die zeitversetzte Anwendung von Beobachtungen aus einem vergangenen Zeitraum auf Vorhersagen oder Modellierungen zum aktuellen Zeitpunkt.

Es basiert auf der Annahme, dass Beobachtungsdaten aus der Vergangenheit nützliche Informationen über den aktuellen Zustand und zukünftige Trends liefern können.In diesem Experiment verwendeten die Forscher eine Zeitverzögerungsmethode, um die Größe des GEFS/R-Datensatzes zu erweitern.Dieser Vorgang verursacht jedoch keinen zusätzlichen Rechenaufwand für das Modell.

 Testergebnisse

Die Forscher testeten die CSU-MLP-Vorhersagen anhand von 1,5 Jahren Echtzeit-Wettervorhersagen von GEFSv12 und verglichen sie mit manuellen Vorhersagen von SPC. Die entsprechenden Testergebnisse zeigen, dassIm mittelfristigen Prognosebereich sind die Genauigkeit und der Prognosebereich des auf Random Forest basierenden Prognosesystems besser als die von SPC.Wie in der Abbildung unten gezeigt. Mit zunehmender Zeitspanne nimmt jedoch die Prognosefähigkeit beider Systeme ab.

Vergleich der Mittelfristprognosen von CSU-MLP und SPC am 27. März 2022

Abbildung a ist die 4-Tage-Prognose von CSU-MLP und Abbildung b ist die 4-Tage-Prognose von SPC. In,Der schattierte Bereich stellt die vorhergesagte Wahrscheinlichkeit von Unwettern dar.Die kreisförmigen Symbole beziehen sich auf die lokalen Vorhersagen des SPC für Tornados (rot), Hagel (grün) und Stürme (blau), und die unteren linken und rechten Ecken des Bildes stellen den Forecast Skill Score BSS zur Bewertung der Genauigkeit von Wettervorhersagen bzw. die Beobachtungsabdeckung zur Bewertung der Repräsentativität lokaler Wettervorhersagen dar.

In diesem Zusammenhang kamen die Forscher zu dem Schluss, dass die Fähigkeiten und die Genauigkeit des gesamten Vorhersagesystems erheblich verbessert wurden.Dies liegt hauptsächlich daran, dass das auf Zufallswäldern basierende Vorhersagesystem über starke Vorhersagefähigkeiten sowohl bei kontinuierlicher Wahrscheinlichkeit als auch bei Konturen mit geringer Wahrscheinlichkeit verfügt (die Konturen, die durch Bereiche mit geringer Wahrscheinlichkeit bei der Einschätzung von Unwettern gebildet werden)..

Darüber hinaus testeten die Forscher auch den Einfluss unterschiedlicher Regionen und unterschiedlicher Faktoren (Thermodynamik und Kinetik) auf die Prognosen.Es wird untersucht, welche charakteristischen Variablen für die Unwettervorhersage von Bedeutung sind.Das Ergebnis ist in der folgenden Abbildung dargestellt.

Für die Wettervorhersage sind verschiedene Kenngrößen wichtig

Obwohl die spezifischen Auswirkungen der oben genannten Faktoren und Regionen auf die Prognosen noch weiter untersucht werden müssen, haben die Forscher eine vorläufige Einschätzung getroffen: Diese verschiedenen charakteristischen Variablen werden vom Modell weiter erlernt und für Unwettervorhersagen verwendet. Dies zeigt auch, dassDas auf Random Forest basierende Vorhersagesystem wurde weiter trainiert und verbessert und verfügt über eine gewisse Glaubwürdigkeit und Praktikabilität.

Natürlich wiesen die Forscher während dieses Experiments auch darauf hin, dass es im auf Random Forests basierenden Vorhersagesystem noch viele Aspekte gibt, die verbessert werden müssen. Zum Beispiel,CSU-MLP muss auch die Prognosedaten der manuellen SPC-Prognose hinzufügen.Verbessern Sie die Glaubwürdigkeit der Prognoseergebnisse des maschinellen Lernens weiter.

 Eine neue Stufe der KI-intelligenten Meteorologie könnte bevorstehen

Die Menschen haben schon immer danach gestrebt, die Welt zu verstehen und vorherzusagen, und eines der erfolgreichsten Beispiele hierfür ist die Wettervorhersage. In der Antike erstellten die Menschen Vorhersagen meist auf Grundlage ihrer Lebenserfahrung, etwa: „Wenn es Morgenrot gibt, geh nicht raus, aber wenn es Abendrot gibt, kannst du Tausende von Kilometern zurücklegen.“ In der heutigen ZeitWissenschaftler beginnen, Sensoren und Wettersatelliten zu verwenden, um riesige Datenmengen zu sammeln und so genauere Vorhersagen zu erstellen.

Es ist erwähnenswert, dass im gegenwärtigen Stadium der meteorologischen Entwicklung die Hinzunahme von KI die Genauigkeit von Wettervorhersagen erheblich verbessert hat. Laut ausländischen MedienberichtenIn den letzten Jahren ist es Schweizer Wetterforschern mithilfe künstlicher Intelligenz gelungen, Zeitpunkt und Ort von Blitzen vorherzusagen.Das Modell hat derzeit eine Vorhersagegenauigkeit von 80%.

Gleichzeitig investierte IBM bereits 2015 2 Milliarden Dollar in den Erwerb der digitalen und Datenressourcen von Weather Co., der Muttergesellschaft von Weather Channel. Der Grund für die hohe Geldausgabe des Unternehmens lag darin, dass es die Wetterdaten und Prognoseinformationen von Weather Co. mit seinem KI-Dienst Watson kombinieren wollte. sichtbar,Giganten wie IBM sind hinsichtlich des Potenzials der KI in der Meteorologie sehr optimistisch und haben begonnen, Pläne zu schmieden.

Es ist nicht schwer, das vorherzusagen. Obwohl es Tausende objektiver Faktoren gibt, die Wetteränderungen beeinflussen, ist es immer noch schwierig, das Wetter genau vorherzusagen.Doch mit der zunehmenden Integration von KI und Meteorologie könnte eine neue Ära intelligenter, durch KI definierter Meteorologie schneller anbrechen.

PS:

Der Code und der Datensatz dieses Dokuments werden auf der offiziellen Website von HyperAI, Hyper.ai, veröffentlicht. Interessierte Partner können weiterhin aufpassen~