超神经HyperAI · 5 天前

登Nature,剑桥大学等发布首个端到端的数据驱动天气预报系统,预测速度提升数十倍

微信图片_20250409145928(1).png
每日破晓时分,全球数百台超级计算机将大气层切割成数百万个虚拟立方体,通过求解包含热力学、流体力学、辐射传输的偏微分方程组,推演出未来 10 天内地球大气的运动轨迹。这种被称为数值天气预报的技术,自 20 世纪中叶由英国气象学家理查森提出「天气预报工厂」构想以来,已发展成为现代气象预报的基石。从台风路径预测到航班航线规划,从农业播种决策到新能源发电调度,数值预报系统每 6 小时更新的全球大气三维快照,正在以 0.01° 经纬度「约 1 公里」的空间分辨率,重塑着人类与天气的对话方式。

然而,面对日益增长的社会需求,传统基于物理方程的数值预报模式正遭遇计算复杂度指数级增长与预报精度提升边际效益递减的双重困境。 这种背景下,人工智能技术的介入犹如为大气科学安装了新的感知器官——当深度神经网络开始解析卫星云图的细微纹理,当强化学习算法自主优化参数化方案,当生成对抗网络在虚拟场景中预演极端天气,一场气象预报的技术革命逐渐孕育成型。

近日,剑桥大学联合图灵研究所、多伦多大学、微软科学智能中心、欧洲中期天气预报中心、英国南极调查局以及谷歌 DeepMind,共同推出了一款名为 Aardvark Weather 的端到端数据驱动天气预报系统。该系统通过整合观测数据,能够同时生成全球网格化预报与局部站点预报。在多项关键变量及不同提前期的测试中,其全球预报性能超越了传统业务数值天气预报 NWP 基准。 在局部站点预报方面,该系统在长达 10 天的提前期内展现出较高的预报技巧,其表现与经过后处理优化的全球 NWP 基准、以及结合人类预报员输入的先进端到端预报系统相当,进一步的端到端调优显著提升了局部预报的准确性。

相关研究成果以「End-to-end data-driven weather prediction」为题,截至目前已在 Nature 发表未经编辑的版本。

在这里插入图片描述

论文地址:

https://www.nature.com/articles/s41586-025-08897-0

开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,还提供海量数据集与工具:

https://github.com/hyperai/awesome-ai4s

数据集:跨平台、多源融合,构建创新的数据融合策略

为了确保 Aardvark Weather 系统在运行时完全独立于传统数值天气预报 (NWP) 模型,研究人员精心构建了一个跨平台、多源融合的观测数据集。该系统仅选用处理级别达到 1B 或 1C 的卫星数据, 其中 1B 级数据是指经过校准与地理定位,而 1C 级数据进一步完成了辐射校正和几何处理,确保观测精度符合业务部署要求。所有数据覆盖 2007 至 2020 年时间跨度,并支持实时获取,为系统提供了稳定的数据流。

陆地观测数据来自英国气象局的 HadISD 数据集, 包含 8,719 个站点的表面温度、8,016 个站点的气压、8,721 个站点的风速及 8,617 个站点的露点温度,每 6 小时更新一次。海洋观测则依托美国 NOAA 的 ICOADS 数据集,整合了全球船只和浮标的实时观测。上层大气观测数据来自 NCEI 的 IGRA 档案,覆盖 1,375 个探空站点的温湿风廓线,研究团队特别选取了表面及 200、500、700、850 百帕等关键气压层次的观测记录。

此外,现场观测的地理局限性促使研究者引入多源遥感数据。该研究利用欧洲 EUMETSAT 提供的 MetOp 系列卫星 ASCAT 散射计数据,与 NCEI 提供的 ATOVS 系统(包括 AMSUA、AMSUB、MHS 和 HIRS/4 仪器)共同构建了微波-红外协同观测网络。研究团队进一步利用 NCEI 的 IASI 高光谱红外探测数据,补充了温度湿度垂直分布的细节信息。对于静止卫星观测,研究团队选择了 NCDC 的 GridSat 网格化产品,通过标准化红外和水汽通道数据,消除了轨道卫星的时空异质性问题。

值得注意的是,尽管 Aardvark 系统在运行时完全脱离 NWP 模型,但其模块化架构在训练阶段巧妙利用了 ERA5 再分析数据集。ERA5,即欧洲中期天气预报中心 (ECMWF) 第五代再分析,是一个最先进的全球大气再分析数据集,可提供从 1940 年至今的温度、湿度、风场等参数的完整时空序列。通过这种创新的数据融合策略,Aardvark Weather 不仅突破了传统数值模式的局限,更将数据驱动模型的实时性与高精度优势发挥到极致,为全球天气预报技术开辟了全新范式。

Aardvark Weather:所需算力更低,预测速度提升数十倍

Aardvark Weather 是一款创新的深度学习驱动端到端天气预报系统,其核心架构由编码器 (encoder module)、处理模块 (processor module) 和解码器 (decoder modules) 三大模块构成。 该系统的设计初衷是在部署阶段摆脱对传统数值天气预报产品的依赖,同时在训练阶段充分利用高质量的历史再分析数据来提升模型性能。

编码器负责整合多源观测数据,无论是网格化还是非网格化数据,都能生成初始大气状态。这一过程采用非递归方法,有效规避了传统数值天气预报中卡尔曼滤波递归更新可能出现的梯度不稳定性等问题。处理模块基于初始状态生成 24 小时预报,并借助自回归机制扩展至更长提前期。解码器则将网格化预报转化为局部站点预报,支持多任务扩展,进一步拓展了系统的应用范围。

在这里插入图片描述

Aardvark 的运行方式

在模型架构上,编码器和处理模块以视觉 Transformer (ViT) 为 backbone,解码器则采用轻量级卷积网络,这种组合既保证了处理效率,又兼顾了模型的灵活性。在训练策略上,Aardvark 先利用高保真的历史再分析数据(如 ERA5)进行预训练,学习纠正观测偏差,再通过分阶段微调优化各模块,确保训练与部署的一致性。最终通过联合微调进一步提升特定区域和变量的预报精度。这种模块化设计和训练方法,使得 Aardvark 在部署时能够完全独立于传统数值模式,充分发挥数据驱动模型的实时性和高精度优势。

在评估 Aardvark Weather 的全球网格化预报性能时,研究团队将其与 4 个基线模型进行了比较。最简单的基线是持续性 (Persistence) 和小时气候 (Climatology),用于评估预报系统是否具备基础能力。更具挑战性的比较对象则是 2 种最广泛使用的确定性业务全球 NWP 系统:欧洲中期天气预报中心 (ECMWF) 的高分辨率 HRES 配置的集成预报系统 (IFS) 和美国国家环境预报中心的全球预报系统 (GFS)。结果显示,Aardvark 在大多数提前期上与 GFS 相当甚至优于 GFS。此外,对于大多数变量,Aardvark 的性能接近 HRES。尽管 Aardvark 在更高大气层和较短提前期的误差较大,这可能是由于靠近地表的观测数据更为集中,但对于较长的提前期,Aardvark 的预报倾向于变得光谱模糊,这是数据驱动天气预报系统中的常见现象。

研究结果还表明,Aardvark Weather 作为首个完全端到端的数据驱动天气预报系统,通过学习从原始观测数据到预报输出的直接映射,在部署时完全不依赖于 NWP 产品,仅依靠观测数据完成预报生成,生成速度比现有系统快几个数量级。从观测数据生成完整预报,Aardvark Weather 系统仅需在四块 NVIDIA A100 GPU 上花费约一秒钟。相比之下,传统的欧洲中期天气预报中心 (ECMWF) 高分辨率 (HRES) 系统仅执行数据同化和预报就需要约 1,000 个节点小时。即使使用的观测数据量比业务基线少一个数量级,且计算资源需求比传统方法少几个数量级,Aardvark 仍能在 1.5 度全球网格上生成预报,并在多个变量和提前期的均方根误差 (RMSE) 上优于业务 NWP 系统。

在这里插入图片描述

基于 ERA5 数据集的网格化全球预报性能分析

AI 已在数值天气预报领域广泛应用

当前,全球气象科学正经历着由人工智能技术引领的范式变革,我国科研力量在这场技术革命中展现出强劲的突破态势。依托深度学习算法的迭代创新,国内研究机构已构建起覆盖天气预测全链条的智能模型体系, 不仅显著提升了预报精度和效率,还推动了气象学科与 AI 的深度融合。

例如,作为全球首个适配地球坐标系统的三维神经网络模型,华为盘古气象大模型突破了传统数值预报的物理方程依赖,其创新的层次化时域聚合策略有效抑制了迭代误差累积,使全球中期天气预报分辨率达到 0.25° 的业界新高。复旦大学伏羲气象大模型则另辟蹊径,通过多任务学习框架实现气象要素协同预测,其纬度加权损失函数设计巧妙解决了高纬度地区预测精度衰减的行业痛点,特别是在小到中等降水事件的预测准确率上取得显著提升。

在专项预报领域,上海人工智能实验室的「风乌」系统通过多模态融合技术,将台风路径 120 小时预报误差压缩至 121.4 公里的突破性精度,较欧洲中期天气预报中心 ECMWF 的 293.8 公里误差实现跨越式提升。崂山实验室「问海」海洋预报大模型则开创性地将海洋动力学原理嵌入神经网络架构,构建起全球首个 1/12° 分辨率的智能海洋环境预报系统。

不仅如此, 中国气象局主导的「人工智能天气预报大模型示范计划」正推动技术成果加速转化,已发布的风清、风雷、风顺等系统, 标志 AI 技术从研究向应用转型。其中,「风雷」系统首创物理引导与数据驱动混合架构,这种「数理融合」的技术路径有效弥补了纯 AI 模型在极端天气事件解释性方面的短板。而「风清」大模型以 3 分钟生成 15 天全球预报的惊人速度,将核心要素有效预报时效延长至 10.5 天。 正在建设中的「风顺」次季节预测系统,则标志着 AI 技术开始向气候预测这个更高难度的领域延伸。

尽管国内 AI 气象大模型的研究已从技术验证迈向业务应用,其高效率、低成本的优势为全球气象预测带来了新的范式。然而,物理机制的解释性、数据的实时性以及极端事件的建模仍是亟待突破的难题。随着物理-数据融合框架的不断深化以及跨学科合作的加强,AI 技术有望从分钟级的短临预报到季节尺度的气候预测,推动天气预报进入更高精度、更广泛应用的新时代。

推荐阅读
关注数
703
文章数
571
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息