今天小编分享的科技经验:大模型到底能不能预测恶劣天气,欢迎阅读。
春节临近,想必不少人已经踏上回家的旅程了吧,但由于这两天突然出现的降温,让不少朋友都遇到了极端天气,甚至出现了飞机、火车延误或取消的情况。这种突然出现的极端天气,让天气预报变成了玩具一样的东西。
但现在,这种情况或许马上就要改变了。当前有不少的大语言模型已经拥有了高准确度的天气预测能力。相比传统的天气预测技术,这些被称为大型 AI 气象预测模型(Large AI Weather forecast Model,LWMs)在极端天气预测方面有着更好的效果。
盘
古气象(Pangu-Weather)
盘古气象(Pangu-Weather),是一款由华为推出的天气预测系统,它利用深度学习技术来提高天气预报的准确性。
盘古气象提高预测准确性有两个关键策略,包括一个定制的 3D 地球特定变换器(3DEST)架构,它可以将高度信息格式化为立方体数据;此外研究团队还设计了一个应用分层时间聚合算法来减轻累积预报误差。研究显示,盘古气象在短到中等范围的预报(即从一小时到一周的预报时间范围)显示出巨大优势。而且该系统还支持极端天气预报和多种集合预报。
在极端天气事件预报方面,盘古气象展现出显著的优势。在测试 2018 的 88 个命名热带气旋的跟踪上,其 3 天和 5 天的平均直接位置误差均低于 ECMWF-HRES,分别为 120.29 公里和 195.65 公里,优于后者的 162.28 公里和 272.10 公里。
不过盘古气象仍存在一些局限性和改进空间。由于其训练数据基于 ERA5 再分析数据,会存在较大偏差,尤其是在强度预测方面。其次,盘古气象训练过程中需要大量计算资源,训练以及定期维护的成本极高。而且盘古气象在未见过的数据或不同气候条件下的泛化能力尚需验证。
GraphCast
GraphCast 是由 Google DeepMind 开发得一个基于图神经网络的天气预测模型,它能够处理复杂的空间依赖关系,并在全球范围内提供准确的天气预报。
GraphCast 利用 GNNs 在处理复杂空间依赖关系方面的优势,以提升天气预报的准确性。在预测过程中,GraphCast 会西安进行数据预处理,将气象数据转换为图篇结构,每个节点代表地理位置,并用边来表示空间关系;之后,GraphCast 将为图中的每个节点提取特征,如温度、湿度、风速等;然后利用图神经网络建模,通过聚合邻居节点的信息来更新每个节点的内容,学习复杂的空间依赖关系;接着进行时间序列预测,预测未来一段时间内各个节点的气象数据变量;最后,对预测结果进行处理和评估,提高预报的可读性和准确性。
GraphCast 同样存在问题。GraphCast 的性能很大程度上依赖于高质量和全面的气象数据,数据的缺失或不准确性可能会影响模型的预测结果。此外,尽管 GraphCast 能够处理复杂的空间依赖关系,但在实时更新和快速响应天气变化方面可能仍然存在挑战。
风乌(Fengwu)
风乌是一款面向全球的中程天气预报系统,由上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布。它采用了多模态和多任务学习的深度学习架构,包括模型特定的编码器 - 解码器和跨模态融合 Transformer。这些组件在不确定性损失的监督下学习,以地区自适应的方式平衡不同预测器的优化。风乌还引入了重放缓冲区机制,通过存储先前优化迭代的预测结果并用作当前模型的输入,提高了长时预测性能。
风乌最大的特点,就是利用多模态和多任务学习能力来预测天气,可以将全球气象有效预报提高到 10.75 天。它在 ERA5 再分析数据上进行了等同 39 年时间的训练,能够准确模拟大气动力学,并预测 37 个垂直层次的未来陆地和大气状态。
性能评估显示,风乌在大多数预测目标上的表现优于 GraphCast,例如将 10 天领先全球 z500 预测的均方根误差(RMSE)从 733 降低到 651 m²/s²。它在 NVIDIA Tesla A100 硬體上的推理成本仅为 600 毫秒,与 GraphCast 相比,在训练和推理方面的计算成本更低。
和其他同类模型一样,风乌也面临着数据和成本的挑战,而且随着气候模式的变化,风乌需要定期更新以保持准确性,这需要持续的资源投入和专业知识。
ClimateNet
ClimateNet 是一个利用卷积神经网络从卫星影像中识别气候特征的模型,旨在解决天气和气候科学领網域中识别、检测和定位极端天气事件的挑战。ClimateNet 通过 ClimateContours 工具进行数据集创建,允许专家标注气候事件,并基于 LabelMe 进行了优化。其研究团队进行了多次标注活动,产生了数百个专家标注的气候数据快照,形成了 ClimateNet 数据集,并进行了严格的质量控制。
ClimateNet 使用 DeepLabv3+ 架构训练深度学习模型,实现了对气候数据的像素级分割。模型在两个不同的气候模型场景下进行了训练和测试,并展示出了优于基于启发式算法的模型的性能。此外,ClimateNet 的应用案例显示了如何利用其分割结果进行条件降水分析,有助于理解气候变化对极端天气事件的影响。
尽管 ClimateNet 取得了显著进展,但因为训练数据有限,且需要持续的更新和维护,ClimateNet 目前还处于研究阶段,并没有被正式投入使用。
伏羲(FuXi)
伏羲是一款基于机器学习的天气预报系统,能够提供 15 天的全球天气预报,具有 6 小时的时间分辨率和 0.25° 的空间分辨率。该系统基于欧洲中期天气预报中心(ECMWF)的 ERA5 再分析数据集开发,并通过等同 39 年时间的数据训练而成。
伏羲采用了一种新颖的级联机器学习模型架构,由三个预训练的伏羲模型组成,分别针对 0-5 天、5-10 天和 10-15 天的预报时间視窗进行优化。这些模型通过级联方式生成完整的 15 天预报。伏羲在 15 天预报中的表现与 ECMWF 集合平均相当,显著减少了累积误差,提高了长期预报的准确性。为了处理天气预报的不确定性,伏羲还提供了一个有 50 成员的集合预报。
伏羲目前最大的问题是其预报时间在 9 天后便会出现性能下降的情况,而且伏羲的预测玩去哪依赖于 ECMWF 的 ERA5 再分析数据集,法完全独立于传统的数值天气预报模型,这让它当前还难以投入到实际应用之中。
除了这些较为成熟的大型 AI 气象预测模型之外,还有不少模型正在训练之中,以减少极端天气可能带来的影响。当然,由于成本、维护、精确度等问题,现在的天气预测模型还难以做到全面准确,但相信随着技术的发展,将来会有越来越多的 AI 模型被投入使用,让过年回家的道路 " 畅通无阻 "。