17日前

SEVIR:レーダーおよび衛星気象学におけるディープラーニング応用を目的としたストームイベント画像データセット

{Chris Mattioli, Siddharth Samsi, Mark Veillette}
SEVIR:レーダーおよび衛星気象学におけるディープラーニング応用を目的としたストームイベント画像データセット
要約

近年の深層学習アプローチは、降水短時予報、合成レーダ画像生成、前線検出など、気象分野における多くの応用において有望な成果を上げている。こうした複雑なアルゴリズムを効果的に訓練・検証するためには、高解像度の画像を含む大規模かつ多様なデータセットが必要不可欠である。地上静止気象衛星システム(GOES)や次世代レーダー(NEXRAD)などから得られるペタバイト規模の気象データは公開されており、利用可能ではあるが、その巨大さと複雑さが深層学習モデルの開発および訓練を阻害する要因となっている。この課題に対処するため、本研究では「Storm EVent ImagRy(SEVIR)」データセットを紹介する。SEVIRは、複数のセンサーから得られる空間的・時系列的に整合されたデータを統合した単一の豊富なデータセットであり、深層学習モデルのベースライン実装および評価指標も併せて提供することで、新たなアルゴリズムの創出を加速することを目的としている。SEVIRは、10,000件以上の気象イベントを含む注釈付きで洗練されたデータセットであり、各イベントは4時間にわたり384 km × 384 kmの画像系列で構成されている。SEVIRの画像は、以下の5つの異なるデータタイプについて、空間的・時系列的に正確にサンプリング・整列されている:GOES-16先進基準イメージャーの3チャンネル(C02、C09、C13)、NEXRADの垂直統合液水量モザイク、およびGOES-16地上静止型雷撃マッパー(GLM)の雷撃イベント。SEVIRに含まれる多くの気象イベントは、米国国家気象局(NOAA)の「Storm Events Database」に照合・一致させられており、雷撃や降水量、被害状況といった追加の記述情報と、センサーが提供する豊富な画像データを関連付けることが可能となっている。本研究では、データ収集の手法を詳細に説明し、SEVIRデータセットの実用例として、深層学習を用いた気象分野における2つの応用例(降水短時予報および合成気象レーダー画像生成)を示す。さらに、これらのモデル出力の評価に使用可能な一連の評価指標についても記述する。SEVIRデータセットおよび選定された応用事例のベースライン実装は、すべて公開されており、ダウンロード可能である。