“人工智能+气象”
智联未来
观测数据能直接驱动“智脑”输出预报结论,不再需要经过复杂的同化等流程;人工智能将在深度学习的基础上自主凝练出极端天气气候机理理论,带来研究范式的变革;在保障城市安全运行、助力应对气候变化等方面,自动化、数字化、智能化的服务形式将成为主流……
有了人工智能技术赋能,这些气象领域的“未来场景”也许很快就会成为现实。
今年,“人工智能+”首次被写入政府工作报告,气象部门已经在积极拥抱新技术,不断拓展人工智能气象应用领域,开发新技术、新模式。
一种认识:“人机协作”模式仍占主导
人工智能(AI)一词最早诞生于1956年达特茅斯学会上,它是研究、开发用于模拟、延伸和扩展人的智能理论、方法、技术及应用系统的一门新的技术科学,研究领域涉及机器人、语言识别、图像识别、自然语言处理和专家系统等。
从ChatGPT到Sora,从单模态到多模态,从单一智能到通用智能,全球人工智能创新热潮迭起,但我们需意识到,在未来很长一段时间内,包括气象在内的众多领域中“人机协同”模式依然占主导——在这种模式中,人工智能提供建议,最终任务的完成仍需要人类介入。
以气象业务的“龙头”——预报为例,人工智能技术的引入,可能带来的是更准的目标识别、更高的预测准确率和效率、更强的数据挖掘能力……“这本质上还是通过算力、算法对大数据等信息进行挖掘整合继而实现的,是一种数据驱动的预报。”国家气象中心天气预报技术研发室主任曹勇表示,其优势在于运算效率高,且消耗的计算资源极小,非线性的模拟能力强,对预报流程的集约化建设具有重要作用。
比如依托人工智能技术,我国能在30秒内生成未来10天逐6小时全球天气预报;强对流天气预警时间提升至3小时,台风路径预报准确率提升了5%;0至6小时极端强对流天气短时预报能力稳步提升;短临时段降水位置预报更加稳定,1至2小时预报准确率提升1%至5%……
获得这些成果的关键是培育出本行业自有的人工智能大模型,即一个拥有超大规模参数(通常在十亿个以上)、超强计算资源的“智脑”,从而实现类人水平的自我学习和自我演化。
这样的培育或者说“训练”当然需要时间,只不过相较于人类往往十几年乃至数十年的漫长学习生涯,人工智能可能仅需要数周甚至数小时就能“学有所成”。
“但完全的数据驱动也有劣势”,中国气象科学研究院人工智能气象应用研究所所长王亚强说,“因为依赖海量数据,数据质量在一定程度上决定了大模型的运算效果,最重要的是,人工智能目前仍无法解决其不可解释性这一弊端。”
具体而言,机器只能处理“关联关系”而无法理解因果关系,更无法判断学习结果正确与否。比如,研究显示,赤道东太平洋海温区每升高1℃,将会使全球年平均温度上升0.12℃,机器通过学习或许可以捕捉到这一规律,但它永远也无法解释其背后复杂的深层原因。
而数值预报是通过对海量多源观测资料的处理和资料同化,形成高精度格点分析场,在此基础上利用数值模式预报未来天气的演变。“它是有物理规律约束的,具有可解释性。”中国气象局地球系统数值预报中心计算技术室高级工程师井浩说。
此外,“数据驱动”还意味着对“数据之外”的部分缺乏预测和判断能力。曹勇表示,人工智能大模型所做的预报有倾向于均值的偏好,在极端灾害性天气气候事件预报预测方面的能力还有待提升。例如,2023年7月28日9时55分,台风“杜苏芮”登陆福建,预报员也捕捉到更多京津冀极端暴雨的信号。当天16时,中央气象台组织首席大会商,多名专家聚焦一个问题:这次预报的极限能到多少?中国气象科学研究院灾害天气国家重点实验室研究员孙继松率先表示,这种天气形势图自己没见过,“96·8”降水过程与其没法比。中央气象台首席预报员孙军认为,“这次过程是历史上唯一的,对比以往找不到相似案例。”极端天气在历史上如没有相似过程和数值,大模型便无法深度学习,极端值也就无法预报。
基于以上原因,多位专家、学者一致认为,不能简单地、绝对信任地让人工智能大模型主导气象业务流程,至少目前尚不具备条件。
“双管齐下”:实现从业务到科研的全链条应用
人工智能和大数据是气象事业发展的“四大支柱”之一。
早在2017年,国家气象中心便聚焦天气监测、预报预警、产品制作等业务环节,先后发展4类50余个人工智能气象应用模型,显著提升精准预报水平和业务效能。短临预报模型(NowcastNet)、强天气分类预报模型等人工智能技术集成进入中国气象局短临预报业务系统(SWAN 3.0),初步建立以大模型为“核芯”的强对流人工智能产品体系,首次实现精细到乡镇的强对流预警信号客观实时指导;应用人工智能技术发展关键要素分钟级预报,面向大城市等重点区域实现逐10分钟滚动更新的1公里分辨率气象要素格点预报;基于卫星云图的人工智能目标监测技术,助力全球热带气旋监测识别准确率高达80%以上。
气象部门正在加快建设“1+N”人工智能气象预报大模型体系——牵头打造1个自主可控的人工智能气象预报基础大模型,发展面向暴雨、强对流、台风等灾害性天气预报的N个专业适配模型。
当前,国家气象中心联合清华大学研发融合大气物理机制约束的短中期预报大模型,预报效果已稳定超过“盘古”;初步构建基于中国全球大气再分析40年产品(CRA40)再分析数据训练的自主气象大模型;完成5个主流大模型业务部署,建立大模型研发应用反馈机制。
次季节气候预报是气象科学领域的沙漠。国家气候中心、上海科学智能研究院、复旦大学联手打造了“伏羲”次季节大模型。它融合了人工智能技术与气候气象科学,能提供15天的中短期全球预报,具有6小时的时间分辨率和0.25°的空间分辨率,预报精度在评测集上首次达到欧洲中期天气预报中心集合预报的平均水平。
国家气象信息中心研制完成中国第一代大气再分析产品、全球10公里逐小时大气实况分析产品,样本量超150万个灾害天气数据集;建成超过6.2PFlops(一个PFlops等于每秒1千万亿次的浮点运算)的人工智能气象应用支撑算力,依托雄安城市计算中心在国产算力支撑能力建设上布局。
中国气象局地球系统数值预报中心坚持数值预报与人工智能双引擎融合驱动,在资料同化、物理过程参数化方案、卫星图像云检测、模式产品后处理和集合预报等业务全链条中都开展了人工智能应用,实现人工智能模型与传统数值模式的混合建模。同时,研发了基于分布式梯度增强库(XGBoost)技术的CMA 多模式2米温度融合预报模型,在北京冬奥会期间的测试结果表明,预报均方根误差比CMA各模式原始预报降低17%至38%。
中国气象科学研究院在天气识别与反演、天气气候预报预测、水文环境气象应用等方面开展了系列研究,建立基于人工智能技术的降水和雷暴大风临近预报系统;研发 “蓉城·夔牛”智能短临天气预报系统,并服务于区域业务和成都大运会赛事气象保障服务。
与此同时,智能监测正投入使用——
发展智慧协同观测系统。构建地面数据一体化新型业务流程,实现观测数据安全高效直接入“云”。
发展人工智能雷达应用技术。基于多种智能模型,建立天气雷达质量问题数据集和雷达回波外推高质量、长序列数据集;开展天气雷达快速精细化扫描试点。
加强卫星数据智能应用。基于“风云地球”开展台风、强对流等灾害性天气事件的智能监测应用,研制风云卫星人工智能大数据集,建立人工智能降水估计算法与评估模型。
智慧服务正加速转化——
气象预警信息处理技术和系统得到完善。发展基于人工智能的气象灾害预警质控模型,研究基于多元数据融合的预警决策服务产品智能制作技术。
专业气象服务技术和产品进一步优化。利用超分辨率神经网络,完成精细化火场预报产品的生成和应用;基于机器学习多模型优选技术,开展风能太阳能多模式集成预报服务产品研发,在河北、广东等风光场站开展应用检验,集成后均方根误差较原始预报降低20%至30%,有效提高风机轮毂高度风速和向下短波辐射等要素的预报准确率。
“人工智能技术也可以挖掘出大数据中隐含的复杂、非线性关系,帮助我们更好地认识这些自然现象和大气物理规律等。”南京信息工程大学气候与应用前沿研究院院长罗京佳说。
天气业务一体化平台布局 国家气象中心供图
多点发力:打造“人工智能+”新业态
“人工智能+” 与“人工智能”不同,它指的是人工智能作为一种基础性、驱动性的技术力量,与不同领域深度融合,创造出新的产品、服务和商业模式,从而推动传统行业的转型升级和社会经济结构的变革。
具体到气象领域,“人工智能+”的引入,可能带来的是更准的目标识别、更强的预测能力、更快的预测效率、更优的从数据中挖掘规律以和传统数理方程形成互补的方案……
到那一天,气象监测、预报预测、预警、服务等全流程或许都会被重塑,在搭建“气象+”垂直化应用场景时也将贯穿“人工智能+”思维。
为了实现这一图景,中国气象局印发《人工智能气象应用工作方案(2023—2030年)》,制定了一段时期内人工智能气象应用发展路线图,明确将锚定加强人工智能气象应用基础支撑能力建设、开展人工智能气象应用前沿科技研究、统筹推进人工智能研发和气象业务应用、优化气象人工智能应用政策环境等方面重点发力。与河北雄安新区管理委员会于1月4日签订共建雄安气象人工智能创新研究院合作备忘录,打造气象人工智能产学研用一体化格局,使其成为学科特色鲜明、研究队伍精干、研发成果丰硕、运行管理高效的国内一流、有重要国际影响力的人工智能科技创新高地和重要人才中心。
在此基础上,专家学者们认为,当务之急是从眼前做起,脚踏实地,强化技术积累和人才培养。
在技术积累方面,他们认为,要在发展行业模型、应用场景和增强大模型底座能力上做到“两手抓、两手都要硬”。
一方面要借助产业和场景的优势,将大模型与业务流程、产品功能相结合,助力包括气象在内的各行各业实现数字化转型。
360集团创始人周鸿祎建议,政府、气象等相关行业垂直管理部门、重点企业等应率先提供更多政策支撑及应用场景,推动人工智能大模型垂直化、产业化落地。同时打造专属知识平台,在此基础上,让大模型深入具体场景开展垂直训练,以真正满足具体需求。
天娱数科副总经理、山西数据流量谷董事长贺晗认为,应鼓励搭建全国级、地方级、行业级等多层次人工智能大模型技术应用场景供需对接平台,推动具有首创性、示范性的标杆场景项目落地。同时,打造可应用人工智能大模型技术的各类场景,围绕算力平台、大模型开源社区和协作平台、多模态公共数据集等人工智能基础设施资源进行长期投入。
罗京佳也认为,没有应用、没有场景支撑的人工智能技术发展之路无法走得长远。
此外,他和中国科学院院士、北京大学统计科学中心讲席教授陈松蹊都关注到了数据应用问题。罗京佳表示,没有数据,人工智能技术就如无源之水。陈松蹊建议加强公共数据在科研领域的开放共享,也促进非公共机构的数据流动和价值创造,进而推动人工智能和相关研究向前发展。
另一方面,要统筹业务资源,加强大模型底层原理研究,更好地应对算力、数据、模型稳定性、工程能力及安全等多方面的挑战。
王亚强着重强调,在这一过程中要对新技术保持清醒认识,尤其要认识到人工智能技术在气象预报、预测领域的局限性,“不断深化对大气物理各种规律的认识,这是未来突破‘人工智能+气象’技术瓶颈的关键。”
曹勇在关注到技术发展的同时,建议在把人工智能技术引入预报预测等业务流程改造中时,可以考虑对模式、系统的研发和内容发布等全流程进行数字化、智能化、集约化改造,为技术发展构建良好环境。
井浩表示,在技术发展过程中要建立健全检验评估机制,以便及时反馈、及时优化,同时进一步加强与高校、科研院所、社会力量等的合作……
在人才培养上,多位专家、学者认为当下有必要加紧培养一批既懂行业技术又懂人工智能大模型技术的综合型人才。
对此,首都经济贸易大学文化与传播学院副院长郭媛媛建议,高质量推进高等“数智教育”,以人工智能、大数据、云计算和物联网为基础,建设智慧校园,采用专业教学拟真模型等手段,促进大学生将新技术融入学习习惯并创新、创造模式。
贺晗建议行业、学校、企业、科研机构等要联动开设“第二课堂”,加强人工智能通识教育,进一步打造产学研用链条,将教学内容与产业一线紧密结合,培养富有实战经验的人才。
罗京佳建议,要完善人工智能相关学科建设,尤其是鼓励各学科与人工智能技术深度融合,推进交叉学科建设与发展,面向前沿科技,提升具体领域高层次人才的“人工智能+”素养。