为什么气象站和 AI 都测不准天气?

根据气象部门预报,8 月 12 日北京将迎来今年入汛以来最强降雨,引发了社会各界的关注,也让人们开始关注天气预报和背后的科学预测方法。如今在气象观测中,也有了人工智能的加入。

根据气象部门预报,8 月 12 日北京将迎来今年入汛以来最强降雨,各级部门都发出了预警通知。

经过一天一夜的漫长等待,间歇到来的暴雨给网友们提供了诸多灵感,创造了不少广泛传播的段子。也让大家好奇起天气如何预报?如何让天气预报更准确、更及时?

天气预报,归龙王和卫星谁管?

过去,天气预报是基于各类气象观测仪器和多个气象站,把温度、湿度、气压等指标测量出来,汇总后将观测结果绘制到一张图上。

这一张图上,呈现大气不同高度、不同层次的变化,从而预测可能出现的天气。

气象数据十分复杂,往往有数十种来源和类型

不同的气象会使用不同的设施进行检测。例如,地面站直接测量风和降水等,还可以进行温压湿风观测、闪电观测。

雷达观测,比如多普勒雷达可以检测实时测量降水,以及遥感自动观测

我们熟悉的风云卫星就是气象卫星,就是提供多光谱成像,比如昼夜可见光、红外云图,冰雪覆盖、植被、海洋水色、海面温度等;

17 年 9 月,微信将开屏图片更换为由静止轨道气象卫星风云四号 A 星从太空拍摄的祖国全景

如今,天气预报增加了数值预报模式、算法预报等更多客观方法,也有了更加完善的预报系统和观测资料。

气象学,复杂到可以体现国力

气象学研究,不单单是刮风下雨,而是从海洋到天空,涵盖了大气圈、水泉、岩石圈、生物圈、冰冻圈组成的五大圈。

中国气象局影视中心的总工程师,在接受「我是科学家 iScientist 」的采访中提到:「在气象学的研究中,需要用物理来解释大气和海洋的运动,需要用化学了解物质的变化、需要用数学来统计和计算。在寥寥数字的天气预报背后,是大量综合学科的知识积累,是一个国家最强的计算能力和空间探测能力。

我国的天气观测网络已经形成了立体观测,根据中国气象局今年五月的消息,我国气象部门现有地面气象观测站 7 万多个,全国乡镇覆盖率达到 99.6 %,数据传输时效从 1 小时提升到 1 分钟。

国家气象科学数据中心提供了各类公开数据

216 部雷达组成的新一代天气雷达网,成功发射了 17 颗风云系列气象卫星,7 颗在轨运行,为全球 100 多个国家和地区、国内 2500 多个用户提供服务。

目前,太空中有全球 1000 多颗气象卫星,可提供风雨、温度等的大量气象数据,地球上还有数十万个国家级和企业级气象站,它们都在不断收集实时数据。

国家级的气象站为国民生活提供便利,企业级的气象站则是提供商用服务,比如为大型农场、体育赛事、航空业提供更细粒度的气象数据。

天有不测风云,AI 也测不准

根据近期中国产业信息网的数据:未来 5 年中国气象服务产业收入预计达到 3000 亿元人民币。

很多大型企业比如 GE、IBM、Google、松下公司等等都拓展和提供气象方面的数据服务。

 AI 测风云:神经网络 

今年初 Google 发布的 《Machine Learning for Precipitation Nowcasting from Radar Images(根据雷达图像进行降水临近预报的机器学习)》的论文中,Google AI 的研究人员针对 「降水预测的机器学习模型的开发」提出新的研究方法。

论文中的新方法是利用数据驱动、完全不使用大气物理模型来建立短临降水预报模型。仅使用神经网络,通过训练数据集来学习拟合大气物理,而没有使用先验的大气物理基础知识。

在这个方法中,降水预报被看作是一种由图片至图片的转换问题,并利用一种 U-net 结构的卷积神经网来实现预报目的。

 AI 测风云:图像识别 

在气象预测中,雷达数据被转换成图像,通过提取图像的色相、饱和度和亮度等特征,采用图像识别的方法,对不同的天气现象,比如区分降雨、降雪、冰雹、露、霜、雾(霾)。

上排的前三张图,显示了距现在 60 分钟前,30 分钟前和 0 分钟之前的雷达图像,最右边的图片显示 60 分钟后的雷达图像,即临近预报的地面真实情况。

下排左图是为了进行比较,通过应用光流(OF)算法对来自上方前三个面板的数据进行平流建模而产生的矢量场。

光流 OF 是 1940 年代开发的一种计算视觉方法,经常用于预测短期天气演变。
下排右图就 OF 做出的示例预测,它很预测了降水量,不过未能说明风暴的衰减强度。

AI 测风云:高性能计算 

IBM 运行着世界上分辨率最高的全球天气预报模型——全球高分辨率大气预报系统 (GRAF)。它是第一个每小时更新一次的全球天气模型,能够预测地球上几乎任何地方像雷暴这样的小尺度天气系统。

IBM 为 GRAF 打造的豪华数据中心

为了支持 GRAF 这样的大型系统的运行, IBM 为其支持了 84 个 AC922 节点,每个节点配备 4 个 Nvidia V100 GPU 以及 3.5 PB 的 IBM Spectrum Scale Storage ,每天可处理多达 10 TB 的天气数据。

 AI 测风云:AI 说了也不算 

虽然现在看来,人工智能对于气象预测、天气预报提供了很多方面的科研加速。但经过访问行业内的专业学者,我们得知在天气预测中,影响天气变化的因素成千上万个,无论是光照、海水洋流,每一个变量都在时刻不停的变化,也都会影响到气候变化。

涉及到的变量越多,对人工智能训练数据、计算能力的要求就越高,比如北京的这次强降雨,就是在强对流天气提前一天预测和预警,也会存在一定误差,无论是综合研判还是 AI,在气象数据的预测方面,还有很长的路要走。

但能够借助北京这次突如其来的降雨,让更多的人了解到天气预报背后的科学知识和科研力量的投入,也是一场有收获的及时雨。

参考资料:

– 我是科学家 iScientist:《为什么天气预报会有报不准?我们和气象人谈了谈》

– Google:《Using Machine Learning to “Nowcast” Precipitation in High Resolution

–  机器之心《强化数据分析,精准天气预报,人工智能赋能气象研究

– IBM https://www.ibm.com/weather/industries/cross-industry/graf

—— 完 ——