【原】使用机器学习以高分辨率“临近预报”降水

雨夜的博客 2022-02-24

展开全文

天气可以以平凡和严肃的方式影响一个人的日常生活，而预测的精确度会极大地影响他们处理天气的方式。天气预报可以告知人们是否应该采取不同的路线上班，是否应该重新安排计划在周末的野餐，或者甚至由于暴风雨即将来临而需要撤离家园。但是，对于局部风暴或以小时为单位演变的事件（例如雷暴），做出准确的天气预报尤其具有挑战性。

在“基于雷达图像的降水临近预报的机器学习，”我们正在介绍用于降水预测的机器学习模型开发的新研究，该模型通过进行适用于近期的高度局部化的“无物理”预测来应对这一挑战。机器学习的一个显着优势是，给定一个已经训练过的模型，推理的计算成本很低，允许预测几乎是即时的，并且在输入数据的原始高分辨率下。这种降水临近预报专注于 0-6 小时预报，可以生成分辨率为 1 公里、总延迟仅为 5-10 分钟的预报，包括数据收集延迟，即使在这些早期开发阶段，其性能也优于传统模型。

超越传统天气预报

世界各地的气象机构拥有广泛的监测设施。例如，多普勒雷达实时测量降水，气象卫星提供多光谱成像，地面站直接测量风和降水等。下图比较了美国大陆降水的伪彩色复合雷达成像与云层成像通过地球同步卫星，说明了对多源天气信息的需求。降雨的存在与云的存在有关，但并不完全相关，因此仅从卫星图像推断降水具有挑战性。

file

不幸的是，并非所有这些测量都在全球范围内同等存在。例如，雷达数据主要来自地面站，通常无法通过海洋获得。此外，覆盖范围因地理而异，有些位置即使卫星覆盖良好，雷达覆盖范围也可能较差。

即便如此，有如此多不同种类的大量观测数据，预测系统难以将其全部纳入。在美国，国家海洋和大气管理局收集的遥感数据(NOAA) 现在每天达到 100 TB。NOAA 使用这些数据为在超级计算机上运行的大型天气预报引擎提供数据，以提供 1 到 10 天的全球预报。这些引擎是在过去半个世纪中开发出来的，基于直接模拟物理过程的数值方法，包括大气动力学和许多影响，如热辐射、植被、湖泊和海洋影响等。

然而，计算资源的可用性在几个方面限制了数值天气预报的能力。例如，计算需求将空间分辨率限制在 5 公里左右，这不足以解析城市地区和农业用地内的天气模式。数值方法也需要几个小时才能运行。如果需要6小时计算预测，只允许3-4每天运行，并导致预测基于6+小时的旧数据，这限制了我们所发生的事情的认识现在。相比之下，临近预报对于从交通路线和物流到疏散计划的即时决策特别有用。

雷达到雷达预测

作为我们系统可以生成的预测类型的典型示例，考虑雷达到雷达的预测问题：给定过去一小时的雷达图像序列，预测从现在开始N小时后的雷达图像，其中N通常范围从 0-6 小时。由于雷达数据被组织成图像，我们可以将此预测视为计算机视觉问题，从输入图像序列推断气象演变。在这些短时间尺度上，演化主要由两个物理过程主导：云运动的平流和云形成的对流，两者都受到当地地形和地理的显着影响。

file

我们使用数据驱动的无物理方法，这意味着神经网络将学习仅从训练示例中近似大气物理，而不是通过结合大气实际工作方式的先验知识。我们将天气预报视为图像到图像的转换问题，并利用当前图像分析领域的最新技术：卷积神经网络 (CNN)。

CNN 通常由层的线性序列组成，其中每一层都是一组操作，将某些输入图像转换为新的输出图像。通常，除了使用一组卷积滤波器对图像进行卷积之外，层还会改变通道数和它所给图像的整体分辨率. 这些过滤器本身就是小图像（对我们来说，它们通常只有 3x3 或 5x5）。过滤器驱动了 CNN 的大部分功能，并导致诸如检测边缘、识别有意义的模式等操作。

一种特别有效的 CNN 类型是U-Net。U-Nets 有一系列层，这些层被安排在编码阶段，在这些层中，层迭代地降低通过它们的图像的分辨率，然后是解码阶段，在解码阶段，编码阶段创建的图像的低维表示扩展回更高分辨率。下图显示了我们特定 U-Net 中的所有层。

file

U-Net 的输入是一张图像，其中包含过去一小时观测序列中每个多光谱卫星图像的一个通道。例如，如果在过去一小时收集了 10 张卫星图像，并且每张多光谱图像都是在 10 个不同波长下拍摄的，那么我们模型的图像输入将是具有 100 个通道的图像。对于雷达到雷达的预测，输入是过去一小时内 30 次雷达观测的序列，间隔 2 分钟，输出包含对N的预测从现在起几个小时。对于我们在美国的初步工作，我们根据 2017 年至 2019 年期间对美国大陆的历史观察训练了一个网络。数据分为四个星期的时间段，每个时间段的前三周用于训练和第四周用于评估。

结果

我们将我们的结果与三个广泛使用的模型进行比较。首先，来自 NOAA 的高分辨率快速刷新(HRRR) 数值预测。HRRR 实际上包含对许多不同天气量的预测。我们将我们的结果与他们1 小时累积的地表总降水量进行了比较预测，因为这是他们最高质量的 1 小时降水预测。其次，一种光流 (OF) 算法，它试图通过一系列图像来跟踪移动物体。后一种方法通常应用于天气预报，即使它假设大面积的总降雨量在预测时间内是恒定的——这一假设显然被违反了。第三，所谓的持久性模型，是假设每个位置未来下雨的速度与现在下雨的速度相同的普通模型，即降水模式不会改变。相比之下，这似乎是一个过于简单的模型，但鉴于天气预测的困难，这是一种常见的做法。

file

我们使用精确率和召回率(PR) 图来比较模型。由于我们可以直接访问我们自己的分类器，因此我们提供了完整的 PR 曲线（如下图中的蓝线所示）。但是，由于我们无法直接访问 HRRR 模型，而且持久性模型和 OF 都无法权衡精度和召回率，因此这些模型仅由单个点表示。可以看出，我们的神经网络预测的质量优于所有三个模型（因为蓝线高于其他模型的所有结果）。然而，重要的是要注意，当预测范围达到大约 5 到 6 小时时，HRRR 模型开始优于我们当前的结果。

file

ML 方法的优点之一是预测实际上是即时的，这意味着我们的预测基于新鲜数据，而 HRRR 受到 1-3 小时计算延迟的阻碍。这可以为非常短期的预测提供更好的计算机视觉方法预测。相比之下，HRRR 中使用的数值模型可以做出更好的长期预测，部分原因是它使用了完整的 3D 物理模型——云的形成更难从 2D 图像中观察到，因此 ML 方法更难学习对流过程。将这两个系统（我们用于快速预测的 ML 模型和用于长期预测的 HRRR 模型）结合起来可能会产生更好的整体结果，这是我们未来工作的重点。我们也在考虑将 ML 直接应用于 3D 观察。