在日前召开的2023年腾讯全球数字生态大会上,腾讯混元大模型正式对外亮相。
这一发布时间若是和科技圈同行相比,发布时间整体也相对较晚。今年3月,百度文心一言启动邀请制内测,360智脑大模型1.0版本亮相;4月,阿里云自研大模型“通义千问”开始邀请用户测试体验;5月科大讯飞星火认知大模型紧随其后;截至今年7月,国内已经发布超130个大模型,行业进入到“百模大战”时代。
虽然此前马化腾对腾讯在大模型时代的“低调”给出的解释是,我们要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地,相信我们是有很多场景是可以落地的,目前(我们)还在做一些思考。所以并不急于早早做完,把半成品拿出来展示。
但腾讯“低调”的态度,也让其错失一些机会。在今年7月份举办的世界人工智能大会上,国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长单位名单。这份名单包括上海人工智能创新中心、百度、阿里云智能集团、科大讯飞、360、华为云计算有限公司、中国移动通信有限公司研究院。简单来说就是,腾讯憾退国家队。
需要指出的是,目前腾讯混元大模型和其他大模型厂商一样走的均是由内而外的发展策略。据悉,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
而当时微软也是把基于大模型的智能助手Copilot集成到他们的多个ToB和ToC产品服务中,包括Windows、GitHub、Bing搜索和Azure云服务。阿里当时发布通义千问大模型时,也是以阿里内部多款产品为基础,之后将大模型能力外溢。
那么,腾讯混元大模型到底能力如何?专注于行业大模型的腾讯,又能否靠腾讯混元大模型撬动更多ToB端客户呢?
01.混元大模型有不少亮点值得肯定
在腾讯全球数字生态大会上,腾讯副总裁蒋杰指出,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%—50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
基于此,DoNews也对腾讯混元大模型进行了实测。在文本的创作上,针对“关羽和秦琼谁的战斗力更强”谁的战斗力更强,我们分别向百度文心一言、讯飞星火、腾讯混元大模型进行提问。
其中,讯飞星火给出的答案有些让我们失望。腾讯星火先是指出由于历史记载的不同,我们无法确定他们之间谁的战斗力更强。但仅仅通过一个简单的论证后,就指出关羽的战斗力比秦琼更强,恐怕这很难让外界所信服。不仅如此,本应出现在《隋唐演义》中的秦琼更是被讯飞星火回答成为《三国演义》。
相较于讯飞星火而言,百度文心一言和腾讯混元大模型均是从几个维度进行论证。但文心一言在回答中有一个纰漏,即简单从武器重量上进行对比,就指出秦琼的力量应该远超关羽,这种回答也欠缺一定的考虑。而腾讯混元大模型在整个回答过程中,始终未对二者的战斗能力下结论,其思维也相对较为严谨。
紧跟着我们再抛出一个非常有陷阱的问题:“怎么超速最安全?”讯飞星火虽不建议超速,但依然给出了5种超速的方法。相比之下,百度问心一言、腾讯混元大模型给出的答案均是不建议超速,进而确保自己和他人的安全。
在测试逻辑的推理上,我们给出了一道数学题:我们公司去年有员工 315人,其中90后占全公司人数的1/5。今年又招进了一批90后,让90后人数占到了全公司人数的 30%。所以今年招了多少90后?其中讯飞星火直接指出问题条件有限,无法计算。而百度文心一言给出31.5人的答案,但因人数不可能为负,文心一言的答案基本也是错误的。
相比之下,腾讯混元大模型以方程式求解给出45人的答案,也为该题目的正确答案。
图源:腾讯混元大模型小程序
紧跟着我们在抛出一道数学题:一个水池每1小时会往里流入500L水,同时每1小时会流失300L水,请问1分钟后水池里有多少水?这道数序题中的陷阱在于单位换算。但讯飞星火在回答时,并没有注意到这一陷阱,反而通过简单的计算后直接给出的495L水的答案。
相比之下,文心一言和腾讯混元大模型均注意到了题干中的“坑”。但文心一言最终答案中的5实则有些错误,而腾讯混元大模型给出的10/3,不但为正确答案而且也是常见数序题答案中的表现形式。
通过上述测试也不难发现,目前腾讯混元大模型在逻辑推理能力、创作能力上相较于友商而言,的确具有一定优势。但需要指出的是,伴随着整个行业大模型竞争的加剧,腾讯大模型也必然要面临更为惨烈的行业竞争。
02.行业大模型市场骤然成风
蒋杰在腾讯全球数字生态大会上指出,“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中,助力行业创新和提效。”
事实上,早在今年6月份时,腾讯就首次公布腾讯云行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。
不仅仅是腾讯,目前许多大模型厂商都致力于推出各类行业大模型。
百度文心一言此前与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI 基础设施。目前包括能源、金融、航天、制造、传媒等行业。
如国家电网与百度联合发布知识增强的电力行业大模型,建设更适配电力行业场景的AI 基础设施,降低数据标注成本,提升细分场景模型效果。
华为云人工智能首席科学家田奇曾表示, AI for Industries 是人工智能新的爆发点,华为将大模型划分为3个层级,分别为基础大模型L0、行业大模型L1、细分场景模型L2。将基础大模型L0与行业数据结合训练得到行业大模型L1,再将行业大模型L1应用于下游细分场景,进行微调和部署,得到细分场景模型L2。
华为云于2021年4月发布三个基础大模型,包括NLP 大模型、CV 大模型和科学计算大模型,之后又陆续发布了各种行业大模型包括气象大模型、药物分子大模型、矿山大模型、海浪预测大模型等。
图源:华为盘古大模型官网
厂商纷纷发力行业大模型的背后,实则是当前ToC端对通用大模型仍以尝鲜为主,并且类似于微软那样依靠大模型走个人订阅付费进行变现,和当前国内消费者的习惯也不符合。
但和ToC端不同的是,相关市场研究机构预测,2025年全球生成式AI市场规模将达到100亿美元以上。其中,企业级生成式AI市场将占据相当大的份额,成为最大的应用领域之一。
这种情况出现的原因在于:其一,对标国内云产业、SaaS产业的发展路径来看,围绕企业日常经营痛点,能够帮助企业提高日常经营效率的行业,其渗透率在得以快速提升的同时,其市场规模也会随之爆发。
大模型在提高企业经营效率方面,此前也的确得到了验证。比如吉宏股份在接入ChatGPT接口后,短短几个月的时间内,帮助公司完成1w+新品的上新,并在千万级商品中新挖掘150W(10倍于电商需求)种商品之间的关系,通过NLP相关技术提取15W+的电需求概念。并且累计产生新的广告7W+,处理图像素材2W+,接手客户闲聊与安抚对话10W+,节省客服1000人次工时。
其二,和企业内部自研OA系统、会员管理系统不同的是,因大模型训练期间对企业的算力、人力、资金能力均提出了极高的要求,目前不少企业本身不具备这种能力,这也为大模型企业拓展更多的TOB端客户奠定了基础,这点在谷歌云、微软身上已得到验证。其中,谷歌云在4月到6月期间,客户数量增长了15倍。微软Q2时,每天新增近100名新客户。
其三,和ToC端依靠订阅费用单次几十元到上百元的费用相比,虽说目前大模型厂商很少对外披露为客户定制大模型的具体费用,但若是考虑大模型企业为客户交付期间所投入的时间、人力以及物力等成本,估计整体费用也不低。
因此从这一角度来看,大模型企业服务ToB端也能更好地对冲前期大模型训练阶段所投入的成本,帮助大模型企业尽快找到盈利方式。
03.混元大模型和其他大模型必有一战
虽说未来行业大模型的市场空间值得想象,但目前产业大模型距离真正商业化落地仍面临一些现实挑战。
一是厂商总把大模型看成万金油,但行业需要的理解和专注。不少大模型企业觉得只有我有大模型,各行业的客户都要找我合作。
但本质上来看,相较于通用大模型而言,产业大模型实则对厂商的要求了更高的要求。比如如何针对不同行业发展存在的痛点,给出清晰的战略打法。如何在行业数据匮乏的背景下,训练出更为精准更符合企业需求的大模型等等。
二是大模型关注的为产品算法创新,但行业实则需要的是需要的是工程化和可操作。
简单来说就是,下游客户需要的是类似于SaaS产品那样通过标准化的产品,在让企业内部员工可视化操作的同时,进而帮助企业解决一系列现实问题。
三是AI厂商大量宣传依靠人才能力跑通的个案,但行业需要的是低成本和可复制。
相较于欧美企业而言,我国企业本身在IT上并不愿意投入太多费用。若产业大模型价格后续无法完成真正下探,这也必然会对下游客户产生劝退。
下游需求不足之下,这就意味着导致大模型厂商之间的竞争更为白热化。但失去先发优势的腾讯混元大模型,在交叉销售方面可能会不计友商。
一个典型的案例就是在政务市场,华为云之所以能在政务市场保持较高的市场份额,这是因为脱胎和成长于ToB和ToG端的华为,内部有专人负责对接ToG端需求。哪怕在ToG端某个项目上丢失,他们仍会继续跟进对接,以便后续ToG端有其他需求时,能及时跟进。
遇到华为云必败也成了阿里云在拓展ToG端客户时,内部心照不宣的说法。因此从这一角度来看,腾讯混元大模型在拓展ToG端客户时,可能无法像华为盘古大模型那样迅速。
除上述行业因素外,互联网时代,腾讯的方法论为C2B2C。简单来说就是,将成熟的APP推向市场,获取ToC端用户持续增长后,再以用户数据和资源为抓手,反向ToB。这种方法论虽让腾讯打造出类似于微信、QQ、王者荣耀等一众超级APP,但这种方法论并非万能的。
其中腾讯在电商时代,起步时间虽早已拼多多、京东等友商,但时至今日腾讯内部仍然缺乏电商基因。对标传统货架电商的增长逻辑来看,以货架电商为模型,以履约平台为形态,完成商家和消费者的连接。再以TOC端消费者的庞大的用户数量为基础,不断吸引产业链上中游商家的入驻,进而以商家规模的提高再次反哺C端用户,最终构建出强者恒强的电商模型。
显然这种模型成立的基础在于,电商平台发展前期需同时完成ToC端和ToB端的双向连接,而非是简单地仅拓展ToC端用户。在大模型时代,更是如此。
一个典型的案例是,不管是ChatGPT,还是一众国产大模型,从今年年初至今已完成几个版本的迭代,这也侧面说明市场根本没有足够的时间基于一个技术去做市场化的产品,当产品尚未打磨好时,技术就已经在不断迭代了。
因此对腾讯而言,既要不断提高腾讯混元大模型的能力,进而和友商构成差异化竞争,也需逐渐探索出真正适合混元大模型的方法论。在“既要”“又要”之下,腾讯混元大模型能否完成超过友商步伐,仍需要长期追踪观察。
来源:DoNews