Nature, Die Universität Cambridge Und Andere Haben Das Erste Durchgängig Datengesteuerte Wettervorhersagesystem Veröffentlicht, Das Die Vorhersagegeschwindigkeit Um Ein Dutzend Mal Erhöht

Jeden Tag im Morgengrauen zerlegen Hunderte von Supercomputern auf der ganzen Welt die Atmosphäre in Millionen virtueller Würfel und ermitteln daraus die Bewegungsbahn der Erdatmosphäre in den nächsten zehn Tagen, indem sie eine Reihe partieller Differentialgleichungen lösen, die Thermodynamik, Strömungsmechanik und Strahlungsübertragung beinhalten. Diese als numerische Wettervorhersage bezeichnete Technologie hat sich zum Eckpfeiler der modernen Wettervorhersage entwickelt, seit der britische Meteorologe Richardson Mitte des 20. Jahrhunderts die Idee einer „Wettervorhersagefabrik“ vorschlug. Von der Vorhersage der Taifunbahn bis zur Planung von Flugrouten, von der Entscheidung über die landwirtschaftliche Aussaat bis zur Planung der Stromerzeugung aus neuen Energiequellen: Die alle sechs Stunden vom numerischen Vorhersagesystem aktualisierte dreidimensionale Momentaufnahme der globalen Atmosphäre verändert die Art und Weise, wie Menschen mit dem Wetter kommunizieren, und zwar mit einer räumlichen Auflösung von 0,01° Länge und Breite (ca. 1 km).
Angesichts der wachsenden gesellschaftlichen Anforderungen stehen herkömmliche numerische Prognosemodelle auf der Grundlage physikalischer Gleichungen jedoch vor dem doppelten Dilemma eines exponentiellen Anstiegs der Rechenkomplexität und eines abnehmenden Grenznutzens einer verbesserten Prognosegenauigkeit.In diesem Zusammenhang ist der Einsatz von künstlicher Intelligenztechnologie wie die Installation eines neuen Sinnesorgans für die Atmosphärenforschung. Wenn tiefe neuronale Netzwerke beginnen, die subtilen Texturen von Satellitenbildern von Wolken zu analysieren, wenn Reinforcement-Learning-Algorithmen Parametrisierungsschemata autonom optimieren und wenn generative kontradiktorische Netzwerke extreme Wetterlagen in virtuellen Szenen proben, nimmt allmählich eine technologische Revolution in der Wettervorhersage Gestalt an.
Vor Kurzem hat die University of Cambridge in Zusammenarbeit mit dem Turing Institute, der University of Toronto, dem Microsoft Science Intelligence Center, dem Europäischen Zentrum für mittelfristige Wettervorhersage, der British Antarctic Survey und Google DeepMind ein durchgängiges datengesteuertes Wettervorhersagesystem namens Aardvark Weather eingeführt. Durch die Integration von Beobachtungsdaten kann das System gleichzeitig globale Gitterprognosen und lokale Standortprognosen erstellen.Bei Tests mit mehreren Schlüsselvariablen und unterschiedlichen Vorlaufzeiten übertraf die globale Vorhersageleistung den herkömmlichen Benchmark für die operative numerische Wettervorhersage (NWP).Bei lokalen Standortprognosen weist das System eine hohe Prognosefähigkeit mit einer Vorlaufzeit von bis zu 10 Tagen auf und seine Leistung ist mit der des globalen NWP-Benchmarks vergleichbar, der durch Nachbearbeitung und fortschrittliche End-to-End-Prognosesysteme unter Einbeziehung von Eingaben menschlicher Meteorologen optimiert wurde. Durch eine weitere End-to-End-Optimierung wird die Genauigkeit lokaler Prognosen erheblich verbessert.
Die entsprechenden Forschungsergebnisse tragen den Titel „End-to-end data-driven weather prediction“ und wurden in unveränderter Fassung in Nature veröffentlicht.

Papieradresse:
https://www.nature.com/articles/s41586-025-08897-0
Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 100 AI4S-Papierinterpretationen und stellt außerdem umfangreiche Datensätze und Tools bereit:
https://github.com/hyperai/awesome-ai4s
Datensätze: Plattformübergreifende Integration mehrerer Quellen, Entwicklung innovativer Datenfusionsstrategien
Um sicherzustellen, dass das Aardvark-Wettersystem völlig unabhängig von herkömmlichen Modellen der numerischen Wettervorhersage (NWP) ist, haben die Forscher sorgfältig einen plattformübergreifenden Beobachtungsdatensatz aus mehreren Quellen erstellt.Das System verwendet nur Satellitendaten mit Verarbeitungsstufen von 1B oder 1C.Bei Daten der Stufe 1B handelt es sich um Daten, die kalibriert und geolokalisiert wurden, während bei Daten der Stufe 1C eine weitere Strahlungskorrektur und geometrische Verarbeitung durchgeführt wurde, um sicherzustellen, dass die Beobachtungsgenauigkeit den Anforderungen für den Geschäftseinsatz entspricht. Alle Daten decken den Zeitraum von 2007 bis 2020 ab und unterstützen die Echtzeiterfassung, wodurch ein stabiler Datenfluss für das System gewährleistet wird.
Die Landbeobachtungsdaten stammen aus dem HadISD-Datensatz des britischen Wetterdienstes.Enthält die Oberflächentemperatur an 8.719 Stationen, den Luftdruck an 8.016 Stationen, die Windgeschwindigkeit an 8.721 Stationen und die Taupunkttemperatur an 8.617 Stationen, alle 6 Stunden aktualisiert. Die Ozeanbeobachtungen basieren auf dem ICOADS-Datensatz der NOAA der Vereinigten Staaten, der Echtzeitbeobachtungen von Schiffen und Bojen auf der ganzen Welt integriert. Die Beobachtungsdaten der oberen Atmosphäre stammen aus dem IGRA-Archiv des NCEI und decken die Temperatur-, Feuchtigkeits- und Windprofile von 1.375 Messstationen ab. Das Forschungsteam wählte speziell Beobachtungsaufzeichnungen der Oberfläche und wichtiger Druckniveaus wie 200, 500, 700 und 850 hPa aus.
Darüber hinaus haben die geografischen Einschränkungen von Feldbeobachtungen die Forscher dazu veranlasst, Fernerkundungsdaten aus mehreren Quellen einzuführen. In dieser Studie wurden die ASCAT-Scatterometerdaten der MetOp-Satellitenreihe des europäischen Satelliten EUMETSAT verwendet. Außerdem wurde gemeinsam mit dem vom NCEI bereitgestellten ATOVS-System (einschließlich der Instrumente AMSUA, AMSUB, MHS und HIRS/4) ein kollaboratives Mikrowellen-Infrarot-Beobachtungsnetzwerk aufgebaut. Das Forschungsteam nutzte außerdem die hyperspektralen Infrarot-Erkennungsdaten des NCEI IASI, um detaillierte Informationen zur vertikalen Verteilung von Temperatur und Luftfeuchtigkeit zu ergänzen. Für geostationäre Satellitenbeobachtungen wählte das Forschungsteam das Gitterprodukt GridSat des NCDC, das die zeitliche und räumliche Heterogenität von Satelliten in der Umlaufbahn durch Standardisierung von Infrarot- und Wasserdampfkanaldaten eliminiert.
Es ist erwähnenswert, dass das Aardvark-System zwar völlig unabhängig vom NWP-Modell arbeitet, seine modulare Architektur jedoch den ERA5-Reanalyse-Datensatz während der Trainingsphase geschickt nutzt. ERA5, die fünfte Generation der Reanalyse des Europäischen Zentrums für mittelfristige Wettervorhersage (ECMWF), ist ein hochmoderner globaler atmosphärischer Reanalyse-Datensatz, der vollständige räumlich-zeitliche Reihen von Parametern wie Temperatur, Luftfeuchtigkeit und Windfeldern von 1940 bis heute liefert. Durch diese innovative Datenfusionsstrategie durchbricht Aardvark Weather nicht nur die Beschränkungen traditioneller numerischer Modelle, sondern maximiert auch die Echtzeit- und Hochpräzisionsvorteile datengesteuerter Modelle und eröffnet so ein neues Paradigma für die globale Wettervorhersagetechnologie.
Aardvark Weather: Benötigt weniger Rechenleistung und erhöht die Vorhersagegeschwindigkeit um ein Dutzend Mal
Aardvark Weather ist ein innovatives, Deep Learning-basiertes End-to-End-Wettervorhersagesystem.Seine Kernarchitektur besteht aus drei Modulen: Encodermodul, Verarbeitungsmodul und Decodermodulen.Das System wurde entwickelt, um die Abhängigkeit von herkömmlichen numerischen Wettervorhersageprodukten während der Bereitstellungsphase zu beseitigen und gleichzeitig hochwertige historische Reanalysedaten voll auszunutzen, um die Modellleistung während der Trainingsphase zu verbessern.
Der Encoder ist für die Integration von Beobachtungsdaten aus mehreren Quellen (sowohl gerastert als auch nicht gerastert) verantwortlich, um den anfänglichen atmosphärischen Zustand zu erzeugen. Dieser Prozess verwendet eine nicht-rekursive Methode, die Probleme wie Gradienteninstabilität, die bei der rekursiven Aktualisierung des Kalman-Filters in der traditionellen numerischen Wettervorhersage auftreten können, effektiv vermeidet. Das Verarbeitungsmodul erstellt ausgehend vom Ausgangszustand eine 24-Stunden-Prognose und erweitert diese mit Hilfe eines autoregressiven Mechanismus auf längere Vorlaufzeiten. Der Decoder wandelt Gitterprognosen in lokale Standortprognosen um, unterstützt die Multitasking-Erweiterung und erweitert den Anwendungsbereich des Systems weiter.

In Bezug auf die Modellarchitektur verwenden das Encoder- und Verarbeitungsmodul den Visual Transformer (ViT) als Rückgrat, und der Decoder verwendet ein leichtes Faltungsnetzwerk. Diese Kombination gewährleistet sowohl Verarbeitungseffizienz als auch Modellflexibilität. In Bezug auf die Trainingsstrategie verwendet Aardvark zunächst hochpräzise historische Reanalysedaten (wie ERA5) für das Vortraining, um zu lernen, Beobachtungsverzerrungen zu korrigieren, und optimiert dann jedes Modul durch schrittweise Feinabstimmung, um die Konsistenz zwischen Training und Bereitstellung sicherzustellen. Schließlich kann durch gemeinsames Fine-Tuning die Prognosegenauigkeit für bestimmte Regionen und Variablen weiter verbessert werden. Durch dieses modulare Design und die Trainingsmethode ist Aardvark bei der Bereitstellung völlig unabhängig von herkömmlichen numerischen Modellen und kann die Echtzeit- und Hochpräzisionsvorteile datengesteuerter Modelle voll ausschöpfen.
Bei der Bewertung der globalen Gitterprognoseleistung von Aardvark Weather verglich das Forschungsteam es mit vier Basismodellen. Die einfachsten Basiswerte sind Persistenz und stündliches Klima, anhand derer beurteilt wird, ob das Prognosesystem über grundlegende Fähigkeiten verfügt. Anspruchsvoller ist der Vergleich zwischen den beiden am weitesten verbreiteten deterministischen globalen NWP-Systemen: dem Integrated Forecast System (IFS) des Europäischen Zentrums für mittelfristige Wettervorhersage (ECMWF) mit hochauflösendem HRES und dem Global Forecast System (GFS) der US-amerikanischen National Centers for Environmental Prediction. Die Ergebnisse zeigen, dass Aardvark in den meisten Vorlaufzeiten mit GFS vergleichbar oder sogar besser ist. Darüber hinaus liegt die Leistung von Aardvark bei den meisten Variablen nahe an der von HRES. Obwohl Aardvark in der höheren Atmosphäre und bei kürzeren Vorlaufzeiten größere Fehler aufweist, was auf die konzentrierteren Beobachtungen in Bodennähe zurückzuführen sein könnte, neigen Aardvark-Vorhersagen bei längeren Vorlaufzeiten zu spektraler Unschärfe, was ein häufiges Phänomen bei datengesteuerten Wettervorhersagesystemen ist.
Die Forschungsergebnisse zeigen auch, dass Aardvark Weather als erstes vollständig durchgängig datengesteuertes Wettervorhersagesystem die direkte Zuordnung von Rohbeobachtungsdaten zu Prognoseergebnissen lernt. Es ist bei der Bereitstellung völlig unabhängig von NWP-Produkten und basiert zur Erstellung von Prognosen ausschließlich auf Beobachtungsdaten. Die Generierungsgeschwindigkeit ist um mehrere Größenordnungen schneller als bei bestehenden Systemen. Das Aardvark Weather-System benötigt auf vier NVIDIA A100-GPUs nur etwa eine Sekunde, um aus Beobachtungsdaten eine vollständige Vorhersage zu erstellen. Im Vergleich dazu benötigt das herkömmliche hochauflösende (HRES)-System des Europäischen Zentrums für mittelfristige Wettervorhersage (ECMWF) etwa 1.000 Knotenstunden, nur um Datenassimilierung und Prognose durchzuführen. Obwohl die Menge der verwendeten Beobachtungsdaten um ein Vielfaches geringer ist als die betriebswirtschaftliche Basis und der Bedarf an Rechenressourcen um mehrere Größenordnungen geringer ist als bei herkömmlichen Methoden,Aardvark erstellt weiterhin Prognosen auf einem globalen 1,5-Grad-Gitter und übertrifft operative NWP-Systeme im mittleren quadratischen Fehler (RMSE) über mehrere Variablen und Vorlaufzeiten hinweg.

KI wird häufig im Bereich der numerischen Wettervorhersage eingesetzt
Derzeit erlebt die globale Wetterwissenschaft einen Paradigmenwechsel, der durch künstliche Intelligenz vorangetrieben wird, und die wissenschaftlichen Forschungskapazitäten meines Landes haben in dieser technologischen Revolution eine starke Durchbruchsdynamik gezeigt. Basierend auf der iterativen Innovation von Deep-Learning-Algorithmen,Inländische Forschungseinrichtungen haben ein intelligentes Modellsystem aufgebaut, das die gesamte Kette der Wettervorhersage abdeckt.Dadurch wurden nicht nur die Genauigkeit und Effizienz der Prognosen deutlich verbessert, sondern auch die tiefe Integration von Meteorologie und KI gefördert.
Als weltweit erstes dreidimensionales neuronales Netzwerkmodell, das an das Erdkoordinatensystem angepasst ist, durchbricht beispielsweise das Pangu-Meteorologiemodell von Huawei die Abhängigkeit der traditionellen numerischen Prognose von physikalischen Gleichungen. Seine innovative hierarchische Zeitbereichsaggregationsstrategie unterdrückt wirksam die Anhäufung iterativer Fehler und sorgt dafür, dass die Auflösung der globalen mittelfristigen Wettervorhersage einen Branchenhöchstwert von 0,25° erreicht. Das meteorologische Modell Fuxi der Universität Fudan verfolgt einen anderen Ansatz und ermöglicht eine kollaborative Vorhersage meteorologischer Elemente durch ein Multitasking-Lernframework. Sein Design mit einer nach Breitengraden gewichteten Verlustfunktion löst auf clevere Weise das Branchenproblem der verringerten Vorhersagegenauigkeit in Regionen mit hohen Breitengraden und ermöglicht insbesondere eine deutliche Verbesserung der Vorhersagegenauigkeit bei kleinen bis mittleren Niederschlagsereignissen.
Im Bereich der Spezialprognosen nutzt das „Fengwu“-System des Shanghai Artificial Intelligence Laboratory multimodale Fusionstechnologie, um den 120-Stunden-Vorhersagefehler des Taifunpfads auf eine bahnbrechende Genauigkeit von 121,4 Kilometern zu komprimieren, was im Vergleich zum 293,8-Kilometer-Fehler des Europäischen Zentrums für mittelfristige Wettervorhersage ECMWF einen großen Fortschritt darstellt. Das Ozeanvorhersagemodell „Ask the Sea“ des Laoshan-Labors hat die Prinzipien der Ozeandynamik auf innovative Weise in die neuronale Netzwerkarchitektur eingebettet und so das weltweit erste intelligente Ozeanumweltvorhersagesystem mit einer Auflösung von 1/12° geschaffen.
Nicht nur das, Das von der China Meteorological Administration geleitete „AI Weather Forecast Model Demonstration Program“ beschleunigt die Transformation technologischer Errungenschaften. Die Systeme Fengqing, Fenglei und Fengshun wurden veröffentlicht.Es markiert den Übergang der KI-Technologie von der Forschung zur Anwendung. Unter ihnen war das „Wind and Thunder“-System Vorreiter einer Hybridarchitektur aus physischer Führung und datengesteuerter Steuerung. Dieser technische Ansatz der „mathematischen Fusion“ gleicht die Mängel reiner KI-Modelle bei der Interpretierbarkeit extremer Wetterereignisse effektiv aus.Das große Modell „Fengqing“ generiert eine 15-tägige globale Vorhersage mit einer erstaunlichen Geschwindigkeit von 3 Minuten und verlängert so die effektive Vorhersagezeit der Kernelemente auf 10,5 Tage.Das im Aufbau befindliche subsaisonale Vorhersagesystem „Fengshun“ markiert den Beginn der Ausweitung der KI-Technologie auf das schwierigere Feld der Klimavorhersage.
Obwohl sich die Forschung an großen meteorologischen KI-Modellen im Inland von der technischen Verifizierung hin zu geschäftlichen Anwendungen verlagert hat, haben ihre Vorteile der hohen Effizienz und der geringen Kosten ein neues Paradigma für die globale Wettervorhersage hervorgebracht. Allerdings sind die Interpretierbarkeit physikalischer Mechanismen, die Echtzeitnatur der Daten und die Modellierung extremer Ereignisse noch immer schwierige Probleme, die überwunden werden müssen. Mit der kontinuierlichen Vertiefung des Rahmens für die Physik-Datenfusion und der Stärkung der interdisziplinären ZusammenarbeitEs wird erwartet, dass die KI-Technologie die Wettervorhersage in eine neue Ära höherer Genauigkeit und breiterer Anwendung führen wird, von kurzfristigen Vorhersagen auf Minutenebene bis hin zu Klimavorhersagen auf saisonaler Ebene.