当前位置:首页|资讯|华为|字节跳动|百度|腾讯|商汤

华为、字节跳动相继入局大模型,当前的AI赛况如何?

作者:神经童非童发布时间:2023-07-19

中国的通用大模型竞赛进入第一个赛点,此前百度、阿里、腾讯、商汤、360 等国内大厂已经相继宣布入局。《百度阿里、商汤华为推出AI大模型,新一轮的AI大战是概念炒作还是产业风口?| 深度详盘》

目前这项大厂参赛的方式是发布一个通用大模型、或者数个行业大模型底座,从而给行业中的客户提供基于这些基础模型和自身拥有的行业数据精调,打造一个服务自身业务的 AI 应用。

如今,华为和字节也先后参赛,采用的方式略有不同。

华为已经披露了盘古大模型的细节,根据已有的介绍,该模型分为三层架构:L0层的5个基础大模型、L1层的N个行业通用大模型以及L2层可以让用户自主训练的更多细化场景模型。华为云提供了分层解耦的设计,企业用户可以根据自己的业务需要选择适合的大模型开发、升级或精调,从而适配千行百业多变的需求。

据华为介绍,最基层对标的是通用大模型,这一层称之为基础大模型。在这之上还打造了行业模型和场景模型,很关键的一点就是要把各行各业的知识与大模型进行充分的匹配和融合。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

此外,华为云还重点介绍了盘古大模型与具体行业结合的典型案例,涉及政务、气象、铁路、制造、金融等多个行业。通过“5+N+X”的这三层大模型,华为云构建了自己的大模型底座,展示了高度成熟、成体系化的业务能力。

“AI底层应用趋势在于垂直行业的融合”,数字经济应用实践专家骆仁童博士举例,“在国外,我们知道像BloombergGPT其实就是典型的大模型赋能金融行业,所以从发展来看,未来所有的行业领域都要面临AI大模型的重构,行业的智能化都会基于通用大模型延伸。”

在具体的应用中,华为云发布会上介绍的盘古气象大模型在气象领域引起了广泛关注。这项技术可以在极短的时间内提供更精确的气象预测,比传统的气象预测方法要快得多。例如,预测一个台风未来10天的路径,现在只需要单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

在铁路领域,华为利用盘古大模型成功地优化了货车检测助手的应用,大幅度提高了工作效率。通过引入盘古大模型,列检员现在只需要检查过去1/20的列车图片,这相当于提高了20倍的工作效率。

在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用。它可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让煤矿工人的工作环境更加舒适,同时极大地减少了安全事故的发生。

在金融领域,盘古大模型与工商银行合作,提高柜员的工作效率。工行在全国有数万个网点,20万网点柜员。盘古金融大模型能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。

此外,华为还将盘古大模型引入到生产制造领域。在过去,制定器件分配计划往往需要花费3个小时以上才能做齐1天的生产计划。但现在,盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够在1分钟内做出未来3天的生产计划。

最后,盘古药物分子大模型也在药物研发领域发挥着重要作用。它帮助西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。

目前,华为云的盘古大模型已经成功地融入了华为云的产品服务,为华为云的一系列B端产品服务带来了升级和重构。华为云还提到了盘古大模型在机器人领域的应用,基于盘古大模型的自然语言理解能力,机器人可以识别自然语言,执行命令,并具备全域感知引导的自主智能。用户只需要用自然语言向机器人下令,机器人就可以完成拿取物品等命令,过程中会根据所处的环境情况作出自主判断。

字节跳动的大模型是基于旗下火山引擎,名字为火山方舟,提供模型训练、推理、评测、精调等全方位功能与服务。

与其他大厂不同的是,火山没有发布自己的通用大模型或者行业大模型,火山方舟聚合了一批第三方生产商开发的大模型底座。火山引擎向大模型生产商提供构建、训练大模型基座所必须的算力和工具体系,并将这些生产商的大模型聚集到自己的MaaS平台,供应给企业使用。这与微软投资算力供给OpenAI,并基于后者开发的GPT模型向企业提供Azure AI云服务,有相似之处。《微软、谷歌搜索巨头入局!百度能做好类ChatGPT产品吗?》

因此,火山引擎介绍的合作案例也与其他大厂有所差异。目前公布的合作伙伴,包括英伟达这样的上游显卡供应商,以及智谱AI、百川智能、IDEA等当下国内第一梯队的大模型开发商。

企业使用大模型,未来也会呈现“1+N”的模式,除了通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。数字经济应用实践专家骆仁童博士解读到,“火山引擎要做的本质上和其他厂商相同,都是要在大模型时代‘卖水’,只是采用形式有所差异。

火山引擎总裁谭待强调:火山方舟最终服务的是模型的应用方;火山引擎是跟大模型的生产方合作,一部分被精选的大模型厂商在火山方舟上部署,然后对外提供服务。想让企业用户和大模型生产商加入到火山方舟的生态体系,首先要解决的是数据安全的问题。

据火山引擎智能算法负责人吴迪介绍,火山方舟已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。

此外,火山方舟还在探索基于NVIDIA新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。

总的来说,国内的巨头都在竞相研发和推出自己的大模型产品。这些大模型的商业价值主要体现在两个方面:应用赋能和垂直行业赋能。

应用赋能方面,大模型可以被嵌入到各种应用中,提高效率和降低成本。直行业赋能方面,大模型可以帮助各个行业实现智能化转型。比如,将大型语言模型接入自动化的客户服务和流程办公系统,或者用于固定流程、固定模板的辅助工作,都可以显著地提升效率和降低成本。

然而,大模型的发展也面临着一些问题和隐忧。首先是成本问题,训练大型语言模型需要大量的计算资源和能源消耗,入门门槛也是上亿级别的。其次是数据隐私和保护问题,大模型需要收集和使用大量的数据,并且在训练过程中可能涉及到版权纠纷等问题。最后是公平性和偏见问题,大模型可能会存在歧视性、非公平性和价值观存在偏见等问题,需要采取介入更加公平或者防歧视性以及价值观纠偏的算法进行矫正跟审计。

为了解决这些问题和隐忧,需要采取多措并举的方式。一方面需要研究如何降低计算资源和能源消耗的问题;另一方面,还需要注重数据隐私和保护问题。

无论如何,随着华为和字节的参战,AI大模型会呈现更广泛的应用前景和商业价值。然而,随着其发展壮大,也面临着一些挑战和隐忧,需要各方共同努力来解决。只有通过不断的创新和发展,才能让大模型真正成为推动社会进步和发展的重要力量。

商道童言(Innovationcases)欢迎点赞和分享哦!~~

免费电子书:结构化思维 | 荆棘商途 | 年度十词 创新企业案例 | 区块链金融


数字经济应用实践专家 骆仁童主讲课程

智慧应用 |《能源互联网》.《新型电力系统》.《智慧建筑》.《智慧机场》.《智慧交通》.《烟草数字化》.《智慧城市》.《数字政府》

数字应用 | 《大数据及中台》.《区块链》.《元宇宙》

人工智能 |  《人工智能趋势》. 《ChatGPT新纪元》

数字化转型 |《制造业数字化》.《零售业数字化》 

金融类课程 | 《金融科技创新》. 《商业银行变革》 .《数字人民币》

思维与技能 |《数字化管理思维》.《数字化组织变革》.《用户思维》

宏观与趋势 |《2023宏观趋势》.《数字经济》.《双碳战略》.《新能源汽车》

创新与创业 |《创业导师能力提升培训》.《中小企业赋能》




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1