7月7日,华为开发者大会2023(Cloud)将在中国东莞正式拉开帷幕。而在这场大会上,盘古大模型3.0将正式发布。
据此前爆料,在这次会议上,华为盘古大模型将首次明确定位,即“为行业而生”。届时,盘古基础大模型的全栈创新和行业大模型的“炼成术”也将首次对外公布。
提到华为“盘古”AI大模型,还要从余承东开始。2021年4月初,华为常务董事、消费者业务CEO余承东接任华为云CEO,随后在当月的“HDC华为开发者大会”上,一口气带来了六大新品,其中就有华为云盘古系列大模型。
余承东发布的六大创新产品及服务,包括华为云CCE Turbo容器集群、Cloud IDE智能编程助手、GaussDB(for openGauss)数据库、可信智能计算服务TICS、华为云盘古系列大模型(包含全球最大规模的中文NLP大模型及CV大模型等)、多样性计算基础软件。余承东希望发布的六大创新技术,能够帮助开发者抓住智能升级的黄金机会,站在华为的肩膀上创造未来。
在发布会上,余承东称华为云盘古大模型是一款在AI产业界非常、非常、非常震撼的产品。 华为云盘古大模型包括四大系列,包括业界首个千亿级生成与理解中文NLP大模型、业界最大的CV大模型,未来我们将持续推出多模态和科学计算大模型。
华为云盘古NLP大模型在中文语言理解测评中,在总榜、分类榜、阅读理解榜获得三项第一,大幅刷新业界纪录。总排行榜领先第二名1分,这是什么概念?就如同百米赛跑的世界纪录,每次0.01秒的突破,都是在超越极限。
遗憾的是,虽然在大会结束后,盘古大模型一度成为了从业者与网友讨论的焦点,但长达两年的时间内没有什么新消息传出,导致不少人已经逐渐将其忘记。
直到今年3月底,华为云官方才宣布,在沉寂两年后,盘古系列AI大模型即将正式上线。目前,盘古大模型中的NLP大模型、CV大模型以及科学计算大模型都已经被标注为即将上线状态。
6月初,有媒体报道称,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。当时报道的盘古Chat,发布时间就是7月7日在东莞举办的华为开发者大会2023。
不过这一传闻被辟谣,华为表示华为不会有“盘古Chat”此类命名,也不“对标”业界产品,但不用Chat命名不代表不支持。此前华为昇腾计算业务CTO周斌在采访中回应了是否有信心承载ChatGPT这类规模的应用的问题,他认为华为完全没有问题。
其实,华为的盘古大模型已经在部分领域展示出了强大的能力。比如天气预报上,现在国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期预报全球天气》(《Accurate medium-range global weather forecasting with 3D neural networks》)。这也成为多年来,第一篇由中国科技公司作为唯一署名单位发表的《自然》正刊论文。
据介绍,华为云盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上。目前,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中国中央气象台等都在实测中发现盘古预测的优越性。
今年5月,台风“玛娃”走向受到广泛关注。中央气象台表示,华为云盘古大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。
在刚刚结束的第19届世界气象大会上,欧洲中期预报中心也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的AI天气预报模型,展现出了可与数值模式媲美的预报实力。
《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
7月7日,华为开发者大会2023将在中国东莞正式拉开帷幕,并将在国内30多个城市、海外10多个国家开设分会场。华为轮值董事长胡厚崑称,通用人工智能已成为人类社会最热门的话题,华为下一阶段要全力推进人工智能走深向实,一方面深耕算力,打造算力底座,让算力不再成为人工智能的瓶颈。
华为常务董事、华为云CEO张平安在《致全球开发者》的信中表示,AI技术风起云涌,百家争鸣,“Al for Industries”将成为人工智能新的爆发点。届时,华为盘古大模型3.0将正式问世,成为华为参与全球AI大模型竞争的一张重磅船票。同时也正如余承东所言:开发者也能站在华为的肩膀上创造未来。