【原】MetNet-2：用于 12 小时降水预测的深度学习

雨夜的博客 2022-02-15

展开全文

深度学习已成功应用于广泛的重要挑战，例如癌症预防和提高可及性。深度学习模型在天气预报中的应用与人们的日常生活息息相关，从帮助人们计划一天到管理食品生产、运输系统或能源网。天气预报通常依赖于由世界上最大的超级计算机提供支持的传统物理技术。这些方法受到高计算要求的限制，并且对它们所基于的物理定律的近似值很敏感。

深度学习提供了一种计算预测的新方法。深度学习模型不是结合明确的物理定律，而是直接从观测数据中学习预测天气模式，并且能够比基于物理的技术更快地计算预测。这些方法还有可能增加预测的频率、范围和准确性。

file

通过 MetNet-2 进行计算的图示。随着计算的进行，网络处理来自输入的更大的上下文，并对可能的未来天气状况进行概率预测。

在天气预报中，深度学习技术在临近预报方面显示出特别的前景——即提前 2-6 小时预测天气。之前的工作主要集中在对天气数据使用直接神经网络模型，使用MetNet 架构将神经预测从 0 小时扩展到 8 小时，生成长达 90 分钟的连续雷达数据，并解释这些神经网络学习到的天气信息。尽管如此，深度学习仍有机会将改进扩展到更长期的预测。

为此，在“ Skillful 12 Hour Precipitation Forecasts Using Large Context Neural Networks ”中，我们将神经降水模型的预测边界推至 12 小时预测，同时保持 1 公里的空间分辨率和 2 分钟的时间分辨率。通过将输入上下文增加四倍，采用更丰富的天气输入状态，并扩展架构以捕获更远距离的空间依赖性，MetNet-2 大大提高了其前身 MetNet 的性能。与基于物理的模型相比，MetNet-2 的性能优于最先进的HREF 集成模型，可用于提前 12 小时的天气预报。

MetNet-2 特征和架构

像 MetNet-2 这样的神经天气模型将地球观测结果映射到天气事件的概率，例如下午城市上空下雨、阵风达到 20 节或晴天的可能性先。端到端深度学习有可能通过直接连接系统的输入和输出来简化和提高质量。考虑到这一点，MetNet-2 旨在最大限度地减少创建预测所涉及的复杂性和步骤总数。

MetNet-2 的输入包括也在 MetNet 中使用的雷达和卫星图像。为了通过温度、湿度和风向等信息捕获更全面的大气快照——这对于长达 12 小时的更长预测至关重要——MetNet-2 还使用物理模型中使用的预处理起始状态作为这个额外的天气信息。基于雷达的降水测量 ( MRMS ) 充当我们在训练中用于优化 MetNet-2 参数的真实情况（即我们试图预测的内容）。

file

MetNet-2 的概率预测可以被视为对所有可能的未来天气状况进行加权平均。由于其概率性质，MetNet-2 可以被比作基于物理的集成模型，它对由各种基于物理的模型预测的一些未来天气状况进行平均。这两种方法之间的一个显着区别是计算核心部分的持续时间：集成模型需要大约 1 小时，而 MetNet-2 需要大约 1 秒。

file

MetNet-2 进行 12 小时长预测必须克服的主要挑战之一是在输入图像中捕获足够数量的空间上下文。对于每个额外的预测小时，我们在输入的每个方向都包含 64 公里的上下文。这会产生大小为 2048 2 km 2的输入上下文——是 MetNet 中使用的四倍。为了处理如此大的上下文，MetNet-2 采用了模型并行性，即模型分布在Cloud TPU v3-128 的128 个核心上. 由于输入上下文的大小，MetNet-2 用计算效率更高的卷积层替换了 MetNet 的注意力层。但是标准卷积层具有局部感受野，可能无法捕获大的空间上下文，因此 MetNet-2 使用膨胀感受野，其大小逐层加倍，以连接输入中彼此相距较远的点。

file

结果

因为 MetNet-2 的预测是概率性的，所以模型的输出自然会与类似概率的集成或后处理模型的输出进行比较。HREF就是这样一种最先进的美国降水集合模型，它每天两次汇总来自五个不同模型的十个预测。我们使用已建立的指标评估预测，例如连续排名概率分数，它捕获模型预测相对于地面实况观察的概率误差的大小。尽管没有执行任何基于物理的计算，但 MetNet-2 在未来 12 小时内无论是低降水量还是高降水量都能够胜过 HREF。

file

预测示例

下图提供了与基于物理的集合 HREF 和地面实况 MRMS 相比的 MetNet-2 预测的选择。

file file file

解释 MetNet-2 对天气的了解

因为 MetNet-2 不使用手工制作的物理方程，它的性能激发了一个自然的问题：它在训练期间从数据中学习了什么样的天气物理关系？使用高级可解释性工具，我们进一步追踪了各种输入特征在不同预测时间轴上对 MetNet-2 性能的影响。也许最令人惊讶的发现是 MetNet-2 似乎模仿了准地转理论所描述的物理学，它被用作大规模天气现象的有效近似。MetNet-2 能够在典型的高压或低压系统的规模（即天气规模)，这为降水带来了有利条件，这是该理论的一个关键原则。

结论

MetNet-2 代表了为天气预报启用新的建模范式迈出的一步，该范式不依赖于对天气现象的物理进行手动编码，而是包含从观测到天气目标的端到端学习以及对低-精密硬件。然而，在完全实现这一目标的道路上仍然存在许多挑战，包括直接整合更多关于大气的原始数据（而不是使用物理模型的预处理起始状态）、拓宽天气现象集、增加提前期数天和数周，并将地理覆盖范围扩大到美国以外。