SEVIR: Ein Sturmevents-Bild-Datensatz für Anwendungen des Deep Learning in der Radar- und Satellitenmeteorologie

Moderne Ansätze des tiefen Lernens haben vielversprechende Ergebnisse bei meteorologischen Anwendungen wie der Niederschlags-Nowcasting, der Synthese von Radarkarten, der Erkennung von Fronten und weiteren Aufgaben gezeigt. Um diese komplexen Algorithmen effektiv zu trainieren und zu validieren, sind große und vielfältige Datensätze mit hochauflösenden Bilddaten erforderlich. Petabytes an Wetterdaten, beispielsweise aus dem Geostationären Umweltsatellitensystem (GOES) und dem Next-Generation-Radar-System (NEXRAD), stehen der Öffentlichkeit zur Verfügung; dennoch stellt die Größe und Komplexität dieser Datensätze eine erhebliche Hürde für die Entwicklung und das Training tiefer Modelle dar. Um dieses Problem zu bewältigen, stellen wir den Storm EVent ImagRy (SEVIR)-Datensatz vor – einen einheitlichen, umfassenden Datensatz, der räumlich und zeitlich ausgerichtete Daten aus mehreren Sensoren kombiniert, sowie Baseline-Implementierungen von Deep-Learning-Modellen und Bewertungsmetriken enthält, um neue algorithmische Innovationen zu beschleunigen. SEVIR ist ein annotierter, konsolidierter und räumlich-zum Zeitpunkt ausgerichteter Datensatz, der über 10.000 Wetterereignisse umfasst, wobei jedes Ereignis Sequenzen von Bildern mit einer Größe von 384 km × 384 km über einen Zeitraum von vier Stunden umfasst. Die Bilder im SEVIR-Datensatz wurden an fünf verschiedenen Datentypen abgetastet und ausgerichtet: drei Kanäle (C02, C09, C13) des GOES-16 Advanced Baseline Imagers, NEXRAD-Vertikalintegrierte-Liquid-Mosaiken sowie Blitzdaten des GOES-16 Geostationären Blitzmappers (GLM). Viele Ereignisse im SEVIR-Datensatz wurden ausgewählt und mit der NOAA-Sturmereignisdatenbank abgeglichen, sodass zusätzliche deskriptive Informationen wie Sturmschäden und Sturmbeschreibungen mit den detaillierten Bilddaten der Sensoren verknüpft werden können. Wir beschreiben die Methodik zur Datensammlung und illustrieren die Anwendungsmöglichkeiten dieses Datensatzes anhand zweier Beispiele aus dem Bereich des Deep Learnings in der Meteorologie: der Niederschlags-Nowcasting und der Synthese von Wetterradarkarten. Zudem stellen wir eine Reihe von Metriken vor, die zur Bewertung der Modellausgaben genutzt werden können. Der SEVIR-Datensatz sowie die Baseline-Implementierungen ausgewählter Anwendungen sind zum Herunterladen verfügbar.