HyperAIHyperAI
il y a 17 jours

SEVIR : Un jeu de données d’images d’événements orageux pour les applications d’apprentissage profond en météorologie radar et satellitaire

{Chris Mattioli, Siddharth Samsi, Mark Veillette}
SEVIR : Un jeu de données d’images d’événements orageux pour les applications d’apprentissage profond en météorologie radar et satellitaire
Résumé

Les approches modernes du deep learning ont montré des résultats prometteurs dans diverses applications météorologiques, telles que la prévision à court terme de précipitations, la génération de radars synthétiques, la détection des fronts et bien d'autres. Afin d'entraîner efficacement et de valider ces algorithmes complexes, des jeux de données volumineux et diversifiés, comprenant des images à haute résolution, sont nécessaires. Des pétaoctets de données météorologiques, provenant notamment du système de satellites géostationnaires environnementaux (GOES) et du système de radar de nouvelle génération (NEXRAD), sont disponibles au public ; toutefois, la taille et la complexité de ces jeux de données constituent un obstacle au développement et à l'entraînement de modèles profonds. Pour remédier à ce problème, nous introduisons le jeu de données Storm EVent ImagRy (SEVIR), un ensemble unique et riche qui combine des données spatialement et temporellement alignées provenant de multiples capteurs, accompagné de mises en œuvre de base de modèles de deep learning et de métriques d'évaluation, afin d'accélérer l'innovation algorithmique. SEVIR est un jeu de données annoté, soigneusement sélectionné et aligné spatialement et temporellement, comprenant plus de 10 000 événements météorologiques, chacun étant constitué d'une séquence d'images de 384 km × 384 km couvrant une période de 4 heures. Les images du jeu SEVIR ont été échantillonnées et alignées sur cinq types de données distincts : trois canaux (C02, C09, C13) de l’imagerie avancée de base du GOES-16, des mosaïques intégrées verticalement en liquide issues du NEXRAD, ainsi que des éclairs détectés par le capteur Geostationary Lightning Mapper (GLM) du GOES-16. De nombreux événements du jeu SEVIR ont été sélectionnés et associés à la base de données NOAA Storm Events, permettant ainsi de relier à l’image riche fournie par les capteurs des informations descriptives supplémentaires, telles que les impacts des tempêtes et leurs descriptions. Nous décrivons la méthodologie de collecte des données et illustrons les applications de ce jeu de données à travers deux exemples d'applications du deep learning en météorologie : la prévision à court terme de précipitations et la génération de radars météorologiques synthétiques. En outre, nous présentons un ensemble de métriques pouvant être utilisées pour évaluer les sorties de ces modèles. Le jeu de données SEVIR ainsi que les implémentations de base des applications sélectionnées sont disponibles au téléchargement.