天气预报不仅是国际科学前沿问题,也具有重大的经济与社会价值。现有的数值天气预报范式源于20世纪50年代,即利用超级计算机求解大气运动偏微分方程组,实现对未来天气的预报。数值天气预报的成功,被世界气象组织评价为20世纪最重大的科技和社会进步之一。一般情况下,进行未来数天的预报通常需要依托拥有海量算力(例如成百上千个计算节点)的超级计算机花费数小时来完成。近年来,随着再分析等高质量气象资料的不断累积,以数据驱动的人工智能(AI)技术,特别是深度学习方法,逐渐被用于建模多种多样的地球系统动力过程,几乎覆盖了所有受关注的时空尺度天气气候事件。此外,这类模型可部署于专用设备上,只需消耗数秒钟即可完成数天的多变量天气预报。
华为云计算技术有限公司基于人工智能技术,提出了一种适配地球坐标系统的三维神经网络(图1)。基于该方法在1979-2017年全球天气再分析数据上训练后,构建了盘古气象大模型,成功实现了全球中期天气0.25°分辨率的精准预报。评估结果表明,盘古模型在常用的检验指标上,优于全球最先进的欧洲中长期天气预报中心(ECMWF)的确定性业务预报。此外,该模型仅需10秒即可完成全球7天气象预报,功耗较传统数值方法降低1万倍以上。因此,盘古气象模型评选为2023年中国科学十大进展之一。
图1盘古气象大模型的三维神经网络构架
图片来源:Bi K, Xie L, Zhang H, et al. Accurate medium-range global weather forecasting with 3D neural networks[J]. Nature, 2023, 619(7970): 533-538.
近期,我系穆穆教授团队,应《Fundamental Research》期刊邀请,撰写了评述文章《2023年度中国科学十大进展评述——人工智能大模型为精准天气预报带来新突破》。
穆穆教授表示,相较于传动动力系统模式,AI气象大模型几乎不显式表征任何明确的物理知识,且直接使用海量数据训练而来,彰显了一条别具特色的发展路线。这种建模和预报范式的变革也引发了气象领域前所未有的火热讨论:数据驱动的AI气象大模型的预测技巧到底从何而来?这类模型是否可以从大数据中学习到可靠的物理机制?从现有的AI气象大模型预报能力的评估报告来看,能够有效回答上述问题可能比AI气象大模型本身意义更为关键——这可以驱动更为深入的天气/气候事件可预报性研究,挖掘潜在的物理机制,尤其是在数值模式难以模拟的高影响甚至极端事件中。
目前,中国气象局和ECWMF等全球气象业务预报部门已经开始持续记录多个开源AI气象大模型的实时预报技巧,以期揭示其真实预报能力(图2)。但从这类模型的构建和训练的角度看,仍有两个不得不引起重视的关键问题亟待解决,以进一步提升其预报技巧和适用范围。一方面,AI气象大模型的训练大多依赖于再分析资料,其产生依赖于多源观测和复杂动力过程,往往不能实时产生,因此限制了AI气象大模型的预报时效性。另一方面,现有的AI气象大模型均是Transformer网络风格的延伸架构,预报结果的可解释性及决策过程较低,导致可信度不足。发展嵌入先验地球系统物理知识的神经网络,对于进一步增强AI气象大模型来说更为重要。
图2 2020年各模式预报评分
图片来源:https://sites.research.google/weatherbench/
与此同时,穆穆教授还指出,在未来的发展中,除了进一步加强高质量气象资料的获取和共享外,还需要充分发挥AI气象大模型的优势,以拓展其应用范围。主要有以下几点建议:
①构建物理-数据融合驱动的AI模型,使用偏微分方程刻画动力过程,对于物理不明确的过程采用AI建模,以提高系统的可解释性,提升对极端事件的预报技巧;
②充分发挥AI模型高效的优势,加速关键过程(如多种参数化方案、辐射传输等)的积分模拟,促进大规模集合预报、目标观测以及多源资料同化的发展;
③融合多圈层物理要素,加强在次季节到季节尺度上的AI建模,以缓解当前的国际难题。
论文信息:
M. Mu, B. Qin, G. Dai, A commentary of “Artificial intelligence models bring new breakthroughs in global accurate weather forecasting”: Top 10 Scientific Advances of 2023, China, Fundamental Research 4(3) (2024) 690-692.
https://www.sciencedirect.com/science/article/pii/S266732582400116X