台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

AI行业动态11个月前发布 ainavi
11,312 0

台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

编辑 | 萝卜皮

全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度,但无法直接使用历史天气数据来改进基础模型。

Google DeepMind 团队介绍了「GraphCast」,一种直接从再分析数据训练的基于机器学习的方法。它可以在一分钟内以 0.25° 的分辨率预测全球 10 天内的数百个天气变量。

研究人员用 1380 个验证目标进行了测试,GraphCast 在 90% 的验证目标中显著优于当前最准确的操作确定性系统,其预测支持更好的严重事件预测,包括热带气旋跟踪、大气河流和极端温度。

该研究以「Learning skillful medium-range global weather forecasting」为题,于 2023 年 11 月 14 日发布在《Science》。

台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

世界标准时间 2022 年 10 月中旬 05:45,意大利博洛尼亚,欧洲中期天气预报中心 (ECMWF) 的新高性能计算设施最近投入运行。在过去的几个小时里,综合预报系统(IFS)一直在运行复杂的计算,从而预测未来几天和几周的地球天气,并且其第一个预测刚刚开始向用户传播。这个过程每天每六个小时重复一次,为世界提供最准确的天气预报。

IFS 以及更广泛的现代天气预报都是科学和工程的胜利。天气系统的动态是地球上最复杂的物理现象之一,每天,个人、行业和政策制定者做出的无数决定都取决于准确的天气预报,从决定是否穿夹克到逃离危险的风暴。当今天气预报的主要方法是「数值天气预报」(NWP),其中涉及使用超级计算机求解天气控制方程。

数值天气预报的成功在于严格且持续的研究实践,这些实践提供了对天气现象越来越详细的描述,以及数值天气预报如何利用更多的计算资源来提高准确性。结果,天气预报的准确性逐年提高,甚至可以提前很多天预测飓风的路径——这在几十年前还是不可想象的。

虽然传统的数值天气预报可以很好地通过计算进行扩展,但利用大量历史天气数据来提高准确性并不简单。相反,数值天气预报方法是由训练有素的专家创新更好的模型、算法和近似值来改进的,这可能是一个耗时且昂贵的过程。

MLWP 是 NWP 的重要替代方案

基于机器学习的天气预报 (MLWP) 提供了传统 NWP 的替代方案,可以根据历史数据(包括观测和分析数据)训练预测模型。通过捕获数据中不易用显式方程表示的模式,有可能提高预测准确性。MLWP 还通过利用现代深度学习硬件而不是超级计算机来提供提高效率的机会,并实现更有利的速度与精度权衡。

在最近的研究中,MLWP 帮助改进了传统 NWP 相对较弱的区域中基于 NWP 的预报,例如次季节热浪预测和来自雷达图像的降水临近预报,而这些区域无法提供准确的方程和稳健的数值方法。

在中期天气预报中,即预测未来 10 天的大气变量,IFS 等基于 NWP 的系统仍然是最准确的。世界上顶级的确定性操作系统是 ECMWF 的高分辨率预报 (HRES),它是 IFS 的配置,可在大约一小时内以 0.1° 纬度/经度分辨率生成全球 10 天预报。

然而,在过去几年中,在 WeatherBench 等基准的推动下,基于再分析数据训练的 MLWP 中期预报方法一直在稳步发展。基于卷积神经网络和 Transformer 的深度学习架构在粗略于 1.0° 的纬度/经度分辨率下显示出了巨大潜力,最近的研究成果(使用图神经网络 (GNN)、傅里叶神经运算符和 Transformer)报告的性能在少数变量的 1.0° 和 0.25° 上开始与 IFS 相媲美,并且交付时间长达 7 天。

全球中期天气预报的 MLWP 方法

在这里,Google DeepMind 团队介绍了一种用于全球中期天气预报的 MLWP 方法,称为「GraphCast」,它可以在单个 Google Cloud TPU v4 设备上在一分钟内生成准确的 10 天预报,并支持包括预测热带气旋路径、大气河流和极端温度等应用。

GraphCast 将地球天气的两个最新状态(当前时间和六小时前)作为输入,并预测未来六小时的下一个天气状态。单一天气状态由 0.25° 纬度/经度网格 (721 × 1440) 表示,对应于赤道处大约 28 × 28 km 的分辨率,其中每个网格点代表一组地表和大气变量 。与传统的 NWP 系统一样,GraphCast 是自回归的:它可以通过将自己的预测作为输入反馈来「推出」,从而生成任意长的天气状态轨迹。

台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

图:模型示意。(来源:论文)

GraphCast 采用神经网络架构实现,基于「编码-处理-解码」配置的 GNN,总共有 3670 万个参数;按照现代 ML 标准,它是一个相对较小的模型,选择它是为了保持内存占用易于处理。之前基于 GNN 的学习模拟器在学习由偏微分方程建模的流体和其他系统的复杂动力学方面非常有效,这支持了它们对天气动力学建模的适用性。

编码器使用单个 GNN 层将输入网格上表示为节点属性的变量(标准化为零均值单位方差)映射到内部「多网格」表示上的学习节点属性。

多重网格是一个空间均匀的图,在全球范围内具有高空间分辨率。它是通过迭代六次细化正二十面体(12 个节点、20 个面、30 个边)来定义的,其中每次细化将每个三角形划分为四个较小的三角形(导致面和边增加四倍),并将节点重新投影到球体上 。多重网格包含来自最高分辨率网格的 40,962 个节点(大约是 0.25° 处纬度/经度网格点数量的 1/25),以及中间图中创建的所有边的并集,形成具有不同长度的边的平坦层次结构。

处理器使用 16 个非共享 GNN 层在多重网格上执行学习消息传递,从而以很少的消息传递步骤实现高效的本地和远程信息传播。解码器将从多网格表示中学习到的最终处理器层特征映射回经纬度网格。它使用单个 GNN 层,并将输出预测为最新输入状态的残差更新(通过输出归一化来实现目标残差的单位方差)。

在模型开发过程中,Deepmind 使用了 ECMWF ERA5 再分析档案中的 39 年(1979-2017)历史数据。作为训练目标,研究人员对 GraphCast 在 N 个自回归步骤上的预测状态与相应的 ERA5 状态之间的均方误差 (MSE) 进行平均,并按垂直水平对误差进行加权。

在训练过程中,N 的值从 1 逐渐增加到 12(即 6 小时到 3 天),并且损失的梯度通过时间反向传播来计算。使用梯度下降对 GraphCast 进行训练,以最小化训练目标,这在使用批量并行性的 32 个 Cloud TPU v4 设备上花费了大约四个星期的时间。

更好地预警极端天气事件

与真实的部署场景一致,未来的信息无法用于模型开发,Deepmind 团队根据 2018 年以后提供的数据评估了 GraphCast。分析表明,GraphCast 还可以比传统预测模型更早地识别恶劣天气事件。

通过将简单的气旋跟踪器直接应用于 GraphCast 预测,他们可以比 HRES 模型更准确地预测气旋运动。2023 年 9 月份,ECMWF 网站上部署的公开 GraphCast 模型的实时版本,提前约 9 天准确预测了飓风 lee 将在 Nova Scotia 登陆。相比之下,传统预报对于登陆地点和时间的可变性更大,并且只能提前大约六天锁定 Nova Scotia。

GraphCast 还可以表征大气河流——将大部分水蒸气转移到热带地区之外的狭窄大气区域。大气河流的强度可以表明它是否会带来有益的降雨或引发洪水的洪水。GraphCast 预报可以帮助描述大气河流的特征,这可以帮助规划应急响应以及人工智能模型来预测洪水。

最后,在全球变暖的大背景下,预测极端温度变得越来越重要。GraphCast 可以表征地球上任何给定位置的热量何时升至历史最高温度以上。这对于预测越来越常见的热浪、破坏性和危险事件特别有用。

台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟

图:严重事件预测 – GraphCast 和 HRES 的比较。(来源:Deepmind博客)

天气人工智能的未来

GraphCast 现在是世界上最准确的 10 天全球天气预报系统,可以比以前更预测未来的极端天气事件。随着天气模式在气候变化中的演变,GraphCast 将随着更高质量的数据的出现而发展和改进。

为了让人工智能天气预报变得更容易,Deepmind 开源了模型的代码。ECMWF 已经在试验 GraphCast 的 10 天预报,它将为研究人员带来新的可能性 – 从针对特定天气现象定制模型到针对世界不同地区进行优化。

GraphCast 与 Google DeepMind 和 Google Research 的其他最先进的天气预报系统一起,其中包括可提前 90 分钟提供预报的区域临近预报模型,以及已在美国和欧洲运行的区域天气预报模型 MetNet-3,它可提供比任何其他系统更准确的 24 小时预报。

率先在天气预报中使用人工智能将使数十亿人的日常生活受益。除了天气预报之外,GraphCast 还可以为其他重要的地理时空预测问题开辟新的方向,包括气候和生态、能源、农业、人类和生物活动以及其他复杂的动力系统。研究人员相信,经过丰富的真实数据训练的学习模拟器对于推进机器学习在物理科学中的作用至关重要。

代码:https://github.com/deepmind/graphcast

相关报道:

https://deepmind.google/discover/blog/

https://www.nature.com/articles/d41586-023-03552-yDeepMind

https://twitter.com/sundarpichai/status/1724546311054152166

论文链接:https://www.science.org/doi/10.1126/science.adi2336

© 版权声明

关注公众号,免费获取chatgpt账号
免费获取chatgpt

相关文章

暂无评论

暂无评论...