准确预测未来几分钟到几周的天气是一项基本的科学挑战。很多气象机构目前采用的预报是基于大气的物理模型,但这些模型本身受到计算要求的限制且对物理定律的近似值非常敏感。另一种天气预报方法是使用深神经网络(DNNs)。DNNs 在强大的专用硬件(如 GPU 和 TPU)上使用并行计算,发现数据中的模式,并学习从输入到所需输出的复杂转换。
近日,在先前对降水量预报的研究基础上,Google 提出了MetNet
,这是一种用于降水预报的神经天气模型。这种 DNN 能够在未来 8 小时内以 1km 的分辨率预报降水量,时间间隔为 2 分钟。MetNet
的预测时间比目前最先进的基于物理的模型NOAA提前了 7-8 小时。它可以在几秒钟内对整个美国的降水量进行预测,而 NOAA 需要花费一小时。
网络的输入来自雷达站和卫星网络,无需人工标注。模型输出是一个概率分布,Google 用它来推断每个地理区域的降水率和相关的不确定性。下图提供了该网络对美国大陆的预测示例。
MetNet
模型预测结果与 NOAA 多雷达/多传感器系统(MRMS)测量的地面真实值进行了比较。MetNet
模型(上图顶部)显示了从 2 分钟到 480 分钟前预测的每小时 1 毫米降水的概率,而 MRMS 数据(上图底部)显示了在同一时间段内接收到至少每小时 1 毫米降水的区域。
MetNet
不依赖于大气动力学领域的物理定律,它是通过反向传播学习,直接从观测数据中预测天气。该网络使用由多雷达/多传感器系统(MRMS)组成的地面雷达站,以及提供大气中云层自顶向下的视图的卫星系统测量得出的降水量估计值。这两个数据源均覆盖美国大陆,并提供可由网络有效处理的图像类输入。模型以每 64km*64km 执行一次,覆盖整个美国,分辨率为 1 km。然而,与这些输出区域相比,输入数据的实际物理覆盖范围要大得多,因为它必须考虑到在进行预测的时间段内云和降水场的可能运动。
由于以全分辨率处理 1024km*1024km 的区域需要大量内存,因此研究人员使用空间下采样器,通过减少输入面片的空间维度来减少内存消耗。同时,在输入中查找并保留相关的天气模式。然后沿降采样输入数据的时间维度应用时间编码器,对 90 分钟输入数据的 7 个快照进行编码,编码片段长度为 15 分钟。时间编码器采用卷积 LSTM 实现,该卷积 LSTM 特别适合于图像序列。接着,时间编码器的输出被传递到空间聚集器,空间聚集器使用轴向自关注,有效地捕获数据中的长距离空间依赖性,并基于输入目标时间使用可变数量的上下文,以在 64km*64km 的输出上进行预测。这种结构的输出是一个离散的概率分布,估计美国大陆每平方公里的给定降水率的概率。
研究人员根据一个降水率预测基准对 MetNet
进行评估,并将结果与两个基线进行比较:NOAA 高分辨率快速刷新 HRRR 系统,这是目前在美国运行的物理天气预测模型。
Google 的神经天气模型的一个显著优点是,它是为密集并行计算而优化的,并且非常适合在专用硬件(如 TPU)上运行。无论是针对纽约市这样的特定地点还是针对整个美国,预测可以在几秒钟内并行进行。而像 HRRR 这样的物理模型在超级计算机上的运行时间约为一小时。
在下面的图表中,研究人员量化了MetNet
、HRRR 和光流基线模型之间的性能差异。这里展示了这三个模型所取得的性能,在降水率阈值为 1.0mm/h(相当于小雨)时使用 F1 分数进行评估。MetNet 神经天气模型能够在 8 小时内超过 NOAA-HRRR 系统,并且始终优于基于流量的模型。
MetNet
是一个概率模型,随着预测时间的延长,预测的不确定性在可视化中表现为预测的日益平滑。相反,HRRR 并不直接进行概率预测,而是会对未来的降水情况进行单一的预测。下图比较了 MetNet
模型和 HRRR 模型的输出。
从 NOAA MRMS 系统获得的 MetNet
(上)和 HRRR(下)到地面真值(中)的输出之间的比较。注意,虽然 HRRR 模型预测的结构似乎更接近于基本事实,但预测的结构可能严重错误。
与 MetNet
模型相比,HRRR 物理模型的预测更清晰、更结构化。但其结构,特别是预测结构的准确时间和位置的精度较低。这是由于初始情况和模型参数的不确定性造成的。
HRRR(左)从许多可能的结果中预测单个潜在的未来结果(红色),而 MetNet
(右)通过分配未来结果的概率直接解释不确定性。
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning