这段时间,有关人工智能(AI)在气象领域取得进展的新闻报道引发了业内外热烈讨论。
图片来源:图怪兽
有人为AI在气象领域的应用突破而兴奋,但也有人对有关技术的可靠性表示质疑。这一讨论,随着多个AI气象大模型于2022年后的相继亮相而进入高潮。
所谓“AI气象大模型”,简单来说,指的是基于AI的天气预报模型。其核心是基于数据驱动的深度学习算法。
事实上,欧洲中期天气预报中心(ECMWF)在2021年就发布了机器学习未来10年路线图,概述了在天气预报中使用机器学习的计划,提出到2031年,机器学习将完全融入到数值天气预报和气候服务中,并在工作流程的许多领域改进预测及其释用。
2022年以来,国内一些企业、机构相继发布AI气象大模型,并初步得到实践检验。
那么,目前的AI气象大模型有哪些特点?AI在气象领域又有怎样的应用前景?本期圆桌论坛,我们邀请各界专家、学者,畅谈感受,碰撞观点——
(注:以下仅为受访者个人看法,不代表本报观点)
嘉宾
同济大学软件学院副院长 穆斌
华为云计算公司高级研究员 谢凌曦
复旦大学人工智能创新与产业研究院研究员 李昊
中科星图维天信科技股份有限公司高级副总裁匡秋明
中国气象科学研究院人工智能气象应用研究所研究员 梁钊明
中国气象局气象发展与规划院国际气象发展研究团队高级工程师 唐伟
上海中心气象台台长 马雷鸣
中国气象局上海台风研究所副所长 黄伟
上海市气象局科技发展处处长 张晖
01
AI气象大模型的特点
马雷鸣:现有AI气象大模型的特点:一是依靠海量数据驱动。目前的气象大模型都是基于海量数据驱动的深度学习算法,一般需要数十年的大量历史数据样本训练,海量数据依赖是这些大模型的主要特点,而数据质量也在一定程度上决定了大模型的效果。
二是需要强大算力支撑。尽管模型预测所需要的计算资源和时间不长,但大模型的反复训练调试离不开强大的算力支持。例如,盘古大模型用192块V100显卡训练需要16天。
三是踩着“巨人”肩膀。大模型在研发中,常基于先进数值预报等技术产品应用。
谢凌曦:AI模型的特点主要包括两方面。第一,大部分AI模型不需要满足物理方程的约束,而是通过数据驱动的方式进行训练。这使得AI方法容易从大数据中获取知识,但同时可解释性会欠缺。
第二,相较于传统数值仿真方法,AI方法的推理速度非常快,在气象预报上往往能够提速3到4个数量级,训练完成后进入预测阶段不再需要大规模计算集群。
匡秋明:目前在气象领域取得突破的AI模型包括从卫星、雷达图像中识别天气现象等智能感知模型,AI短临、短期、中期、延伸期、气候预测等智能预报模型,ChatGPT等智慧问答模型。
近期大家最关注的AI气象大模型,其主要的特点为:模型迭代改进速度快;取得了与欧洲中心高分辨率模式相仿或部分超越的天气预报性能;预报生成速度快,可以快速完成全球0到15天天气预报。
穆斌:目前面世的AI气象大模型具备超高参数量、超大样本集、超长训练轮次等特点。我认为这些模型“惊人的预报技巧”可归功于以下两点:
一是规避了使用循环神经网络构建AI模型,从而会累积大量迭代误差的常规方法,采用“自回归”的方式进行预测,即,利用输入历史资料中潜在的时空特征,随即直接推断下一步或者后一时间序列的发展。由于这种方式无需约束输入数据与预测结果之间的时序连贯性,可灵活调整时间间隔,极大提升了超长时效的预报技巧。
二是近10年来深度学习模型架构的探索与发展。AI模型可以跟进深度学习社区最先进、最前沿的研究,利用最先进的组件、模块、架构甚至调参经验,尽可能地提升气象预报技巧;但同时因为大部分人员不是专业计算机科学出身,开发气象AI专用模型架构的自主能力较差,只能利用现有的成果。但从最近的发展趋势来看,越来越多AI专家投身气象领域并积极开展深入的交叉合作。
02
AI气象大模型VS数值天气预报
黄伟:数值天气预报通过对海量多源观测资料的处理和资料同化,形成高精度格点分析场,在此基础上利用数值模式对未来天气的演变进行预报。经过近百年发展,已形成一套完整的工作流。目前发布的AI气象大模型,其输入的是数值预报提供的格点再分析情况,输出的是相同格点、相同要素的预报情况,本质上是,“在数值天气预报建立的数据空间下的机器学习”,因而,在预报上存在一些局限性。
同时,目前的AI气象大模型都缺乏长期验证和应用,结果高度依赖再分析数据而非基于真实物理过程,也未涉及关键的资料同化过程,存在对极端天气估计偏弱等问题。因此,目前的气象大模型还不能取代数值预报的全部工作流。
此外,地球系统因其非线性特征而极其复杂,初值信息远超目前气象大模型学习的0.25°分辨率格点资料,目前的AI气象大模型,还不能满足如此海量的观测数据进入气象预报。
但同时,AI提供了相比传统数值模式更高效、更智能化的工作流:从多源观测资料的处理,再到资料同化算法的改进,最后到对非线性复杂问题的处理和极端事件的预报,都显示出巨大潜力。在可见的未来,AI气象预报方法和传统数值天气预报有机结合,形成两者充分融合的预报系统,仍是短期内数值预报取得突破最有可能的方向。
穆斌:数值模式遵守气象动力理论,具备严谨的数学表达,并依托偏微分方程进行时间积分,以流体力学编程技巧实现,具备超高可信度。
相反地,尽管“黑盒”AI模型的预报技巧有所突破,但其内部的决策机制往往是未知的,也意味着气象学家无法得知其做出预报的动力依据,可信度大打折扣。同时,虽然“更准确的预报”是气象研究的第一宗旨,但能够明确潜在的动力机制对于农业生产、防灾减灾等更为关键。因此,我认为AI模型不能,至少在短时间内无法取代数值预报模式的地位。
李昊:我认为AI气象大模型和数值预报不是“取代”而是相辅相成的关系。数值天气预报更符合物理规律,同时不需要大量训练数据。大模型推理速度快、计算资源需求小,同时随着训练数据增多能持续提升效果。随着技术进一步发展,两者会共同促进天气预报的发展。
梁钊明:我认为AI模型在短期内无法取代数值预报。首先,现有AI气象大模型的训练、预测都需要基于数值模式生成的再分析数据“喂养”,也受制于“喂养”大模型的数据分辨率,目前发布的气象大模型基本为6小时、0.25°时空分辨率外推,还达不到逐小时、3千米甚至重点地区1千米的高时空分辨率预报。
再有,现有的AI气象大模型可预报的天气现象以及气象要素较少,如公众日常关注的降水、地面大风等要素还未曾做出预报和开展有效评估。
但目前气象大模型针对大尺度环流、在长时间尺度的预报优势较为明显,普遍能达到10到15天,而在这一时段,数值模式的预报误差普遍偏大。
唐伟:现在还看不到AI模型能完全替代数值预报的迹象。气象大模型现在仍有3点局限性:数据集不够长、过拟合问题、可解释性。
目前发布的这些AI气象大模型都依赖于传统物理模型生成的数据集和初始场,才取得了比数值预报更高的预报准确率。也就是说,这些模型不是真正的数据驱动,而是站在“巨人的肩膀上”才看得更远。
03
AI在气象领域的应用前景如何?
穆斌:AI模型最显著的优势即为运行效率高。因此,除了构建纯数据驱动的AI气象模型外,也可使用AI组件替代动力数值模式中的耗时参数化方案,从效率、准确性等方面全方位升级数值模式。这种智能数值模式本身维持了原模式的动力框架,具备可解释性。
此外,可发挥AI模型高度非线性的优势,从现阶段积累的海量多模态气象资料样本中汲取经验,进一步提升数值模式的预报技巧。如构建AI资料同化方法,研发AI偏差订正与降尺度模块,发展融合AI模型与动力模式的集合预报系统等,尤其可以用在机理尚不明确的气象研究中。
图片来源:即时AI绘图
张晖:多模态是生成式人工智能输入和输出的重要表达形态。利用AI,文本、图片、音频、视频等信息有望在AI技术加持下,根据用户需求持续修正模型,输出各类形态的产品;即便是文本、图片、视频类的天气实况,也可及时投入改善预报模型,并秒级给出修正结果;气象服务也将更智慧,如随时保持与用户在线沟通,提供多模态的服务产品等。
唐伟:AI从气象观测、预报到服务都有很广的应用前景。观测,AI和物联网结合,实现社会化观测;预报,AI和物理模型混合建模;服务,如结合自然语言生成ChatGPT对话式的定制气象服务。总的来说,提质增效。
谢凌曦:AI方法速度很快,一旦应用到日常业务中,会大大加快气象预报系统的响应速度。此外,随着更多气象数据的公开共享,AI算法的能力还会进一步增强,甚至可以出现结合同化、预报、后处理等模块的端到端气象预报算法。
李昊:人工智能为气象领域提供了一个新的研究工具,气象领域的数据非常丰富,场景也多,特别适合人工智能这个新工具去发挥更大作用。
梁钊明:AI气象大模型可以弥补现在预报的一些短板。比如AI气象大模型生成未来天气预报的计算效率非常高,可大大缩短天气预报制作的时间。另一方面, AI可以用来求解描述大气运动的偏微分方程,或在一定的物理约束条件下,利用AI来更好地拟合这种物理关系,这样基于数学和物理基础推导出的结果,会更为合理,预报员用起来也会更有底气。
中国气象报社 出品
策划/统稿:谷星月
编辑:何长剑
鸣谢:武蓓蓓 郭曼如 王瑾 张艺博 赵宁
审核:段昊书
中科致研 2024-12-27
上海钢泽合金 2024-12-27