Das Vom Institut Für Atmosphärenphysik Entwickelte CoTCN-Modell Hat Die Genauigkeit Der Globalen Meeresoberflächentemperaturvorhersagen Deutlich Verbessert, Mit Einem 1-Tages-SST-Vorhersagefehler Von Nur 0,2 °C.

Auf der CCF Global High Performance Computing Academic Conference 2025 berichtete das Team um Forscher Lin Pengfei vom Institut für Atmosphärenphysik der Chinesischen Akademie der Wissenschaften über ein wichtiges Forschungsergebnis.Das Team hat erfolgreich das CoTCN-Deep-Learning-Modell entwickelt, das die Transformer- und CNN-Frameworks verbindet.Im Bereich der kurzfristigen Vorhersage der globalen Meeresoberflächentemperatur wurden Durchbrüche erzielt, die wichtige technische Unterstützung für Prognosen zur Meeresumwelt bieten.
HyperAI hat die ausführlichen Ausführungen des Forschers Lin Pengfei zusammengestellt und zusammengefasst, ohne die ursprüngliche Absicht zu verletzen. Im Folgenden finden Sie die Abschrift der Rede.
Innovative Architektur löst Herausforderungen bei der Modellierung mehrerer Maßstäbe
Veränderungen der Meeresoberflächentemperatur stehen in engem Zusammenhang mit der Luftzirkulation, den Niederschlägen an Land usw. und haben erhebliche Auswirkungen auf die Sicherheit der Seeschifffahrt, die Ökologie der Meeresfischerei und die Überwachung der Meeresumwelt.Herkömmliche dynamische Prognosemodelle weisen jedoch Probleme auf, wie etwa eine langsame Betriebsgeschwindigkeit und eine umständliche Bereitstellung, während Modelle der künstlichen Intelligenz (KI) mit einer einzigen Architektur mit Einschränkungen wie dem Mangel an lokalen Details oder Schwierigkeiten bei der Modellierung globaler Abhängigkeiten konfrontiert sind.Insbesondere in aktiven mesoskaligen Wirbelgebieten wie dem Kuroshio-Strom und dem Golfstrom wurde festgestellt, dass der Temperaturfehler der Meeresoberfläche bei bestehenden dynamischen und KI-Prognosen in wirbelaktiven Gebieten mindestens 40% höher ist als der globale Durchschnitt.
* Beispielsweise kann das in der Vergangenheit entwickelte Long Short-Term Memory (LSTM)-Netzwerk die Zeitreihenentwicklungseigenschaften von SST effektiv erfassen, das Problem des verschwindenden Gradienten herkömmlicher neuronaler Netzwerke überwinden und schnelle und genaue Vorhersagen erzielen. Allerdings fehlt dieser Methode noch immer eine physikalische Erklärung, und ihre Vorhersage extremer Ereignisse hängt von der Abdeckung der Trainingsdaten ab.
doi: 10.3878/j.issn.1006-9895.2302.22128
In der Rede wurde über das neu erstellte CoTCN-Modell berichtet.CoTCN verwendet eine parallele Dual-Branch-Architektur.Es kombiniert auf clevere Weise die globalen Modellierungsfunktionen von Transformer und die Vorteile der lokalen Merkmalsextraktion von CNN.
Zweig 1 erstellt eine mehrskalige Merkmalspyramide basierend auf Swin Transformer.Die Auflösung wird schrittweise von 720×1440 auf 45×90 heruntergerechnet und Informationen unterschiedlicher Maßstäbe werden durch Sprungverbindungen integriert.
Zweig 2 verwendet eine CNN-Encoder-Decoder-Struktur, die speziell für die Aufrechterhaltung der räumlichen Kontinuität und lokaler Details verantwortlich ist.Die beiden Zweige werden durch den Kanalaufmerksamkeitsmechanismus adaptiv zusammengeführt und das Modell kann automatisch bestimmen, ob es sich in verschiedenen Meeresgebieten und auf verschiedenen Skalen eher auf globale Informationen oder lokale Details stützt.
Die beiden Zweige arbeiten zusammen, um die Vorteile von CNN und Transformer hervorzuheben und die Vorhersagegenauigkeit zu verbessern.

Die Leistung übertrifft bestehende Modelle in allen Aspekten
Die Forschung wurde mithilfe globaler Ozeandaten von NOAA OISST v2, die eine 40-jährige Zeitreihe von 1982 bis 2022 abdecken, vollständig validiert. Testergebnisse auf einer inländischen DCU-Computerplattform zeigten, dass CoTCN erhebliche Vorteile gegenüber gängigen Modellen wie ConvLSTM, ConvGRU, AFNO, PredRNN und SwinLSTM aufweist.
In Bezug auf die Prognosegenauigkeit beträgt der mittlere quadratische Fehler (RMSE) von CoTCN für einen Tag etwa 0,2 °C, und der Korrelationskoeffizient bleibt für 10-Tage-Prognosen über 0,8. Im Vergleich der Prognoseindikatoren schneidet CoTCN bei Bewertungsmetriken wie dem mittleren quadratischen Fehler (RMSE), dem mittleren absoluten Fehler (MAE), dem Korrelationskoeffizienten (ACC) und dem Strukturähnlichkeitsindex (SSIM) stabil ab. Noch wichtiger ist, dass das Modell in komplexen Gewässern besonders gut funktioniert.Der Prognosefehler in wirbelaktiven Gebieten wie dem Kuroshio-Strom und dem Golfstrom wurde um 15-60% reduziert, während in relativ ruhigen Gewässern wie dem tropischen Pazifik und Atlantik die Leistungen der Modelle relativ ähnlich sind.

Heimische Rechenleistung unterstützt effizientes Training
Diese Forschung basierte vollständig auf inländischen DCUs für Training und Verifizierung und umfasste Vergleichsexperimente mit mehreren Mainstream-Modellen in einer Testumgebung mit 32 DCUs und einer einzelnen Karte mit 16 GB Speicher.In Bezug auf die Trainingseffizienz schneidet CoTCN gut ab und schließt das Training auf einer 68M-Parameterskala in nur 5,93 Stunden ab.Das AFNO-Modell mit 106 Millionen Parametern benötigte 8,33 Stunden, während die Modelle ConvGRU und PredRNN aufgrund von RNN-Sequenzbeschränkungen 11,28 bzw. 25,04 Stunden benötigten. Dies bestätigt nicht nur die Hochwertigkeit des CoTCN-Modells, sondern zeigt auch, dass die Architekturgestaltung wichtiger ist als die bloße Erhöhung der Parameteranzahl. Es unterstreicht zudem die wichtige Rolle inländischer Hochleistungsrechnerplattformen bei der Unterstützung wissenschaftlicher Spitzenforschung.
Über den Forscher Lin Pengfei
Lin Pengfei ist Forscher am Institut für Atmosphärenphysik der Chinesischen Akademie der Wissenschaften. Er beschäftigt sich hauptsächlich mit der Entwicklung und Anwendung von Ozeanmodellen. Er hat das chinesische globale Ozeanzirkulationsmodell LICOM und dessen gekoppeltes Modell entwickelt. Das globale Ozeanmodell hat eine horizontale Auflösung von bis zu einem Kilometer. Auf Basis von LICOM entwickelte er ein hochauflösendes Vorhersagesystem für die Meeresumwelt und führte intelligente, dynamische, integrierte Prognoseforschung in Kombination mit künstlicher Intelligenz durch. Mithilfe chinesischer Klimasystemmodelle führte er chinesische Superensemble-Simulationsexperimente durch und erforschte eingehend die Veränderungen des Klimasystems zwischen den Jahrzehnten. Er hat über 50 Artikel als Erst- oder korrespondierender Autor in Zeitschriften wie Nature Communications und Science Bulletin veröffentlicht. Er leitete das Projekt des National Key R&D Program und das Pilotprojekt der Chinesischen Akademie der Wissenschaften und war am integrierten Projekt und an Großprojekten der National Natural Science Foundation beteiligt. Er wurde 2024 und 2025 mit dem Supercomputing Annual Best Application Award der China Computer Society ausgezeichnet. Er wurde als einer der zehn größten meteorologischen wissenschaftlichen und technologischen Fortschritte in China im Jahr 2024 und als einer der zehn größten wissenschaftlichen und technologischen Fortschritte in Chinas Ozeanen und Seen ausgewählt.
Papierinformationen:
1. Ein gekoppeltes Transformator-CNN-Netzwerk: Verbesserung der Genauigkeit der Meeresoberflächentemperaturvorhersage. IEEE Transactions on Geoscience and Remote Sensing, 63, 1–14.
https://doi.org/10.1109/TGRS.2025.3574990
2. Ein neues Transformatornetzwerk für die kurzfristige globale Meeresoberflächentemperaturvorhersage: Bedeutung von Wirbeln. Fernerkundung, 17(9), 1507.
https://doi.org/10.3390/rs17091507
3. Kurzfristige Vorhersage der Meeresoberflächentemperatur im äquatorialen Pazifik mithilfe eines Long Short-Term Memory Network (LSTM). Journal of Atmospheric Sciences, 48(2), 745–754.
https://doi.org/10.3878/j.issn.1006-9895.2302.22128
Erhalten Sie mit einem Klick hochwertige Papiere und ausführliche Interpretationsartikel im Bereich AI4S von 2023 bis 2024 ⬇️
