在资本、话题堆叠之下,大模型的狂热已经席卷国内大半年,恍惚间我们已经进入了全民大模型时代。
但其实在8月31日之前,各家AI大模型产品尚处于试用阶段,还并未获得正式面向公众提供服务的资格。前期预热到顶,一直到8月31日一则重磅消息砸下,包括了百度的“文心一言”、中科院的“紫东太初大模型”等国内首批8家企业/机构的AI大模型产品通过了《生成式人工智能服务管理暂行办法》的备案,代表着他们已经正式获得了面向公众提供服务的资格。
据七麦数据显示,“文心一言”App8月31日开放下载首日,在苹果App Store应用商店下载量预估为31.3万次左右,智谱清言App则为3832次。据百度官方公布的数据显示,24小时内,文心一言共计回复网友超3342万个问题。
AI 大模型全面“开闸”是国内大模型发展的一个关键时刻,上述8家大模型产品拥有了先发优势。
国内大模型武力值大比拼正式开始,之前,国内类ChatGPT的大模型产品都无一例外侧重“对话交互型”,各家对大模型实力的比拼,简单地集中在回答问题的精确度、榜单排名这些可量化的维度上,大多数C端用户与AI的对话内容都趋向于闲聊,而没有创造。另一方面,C 端用户的付费意愿低,To C 的通用大模型产品短期内无法复制 ChatGPT 的成功模式,在同质化产品的围攻下被迫加入资源竞赛的烧钱游戏。回过头看,To B 客户付费意愿高,需求大,随着市场回归理性,大模型选择 To B 几乎成为行业内心照不宣的一个范式。
所以未来,大模型竞争的真正赛场主要集中于服务B端用户。眼下,大厂和创业公司们正在将眼光重新聚焦于产业。
在浮华之下,我们开始去挖掘哪些大模型厂商在思考大模型的真正价值——在ChatGPT带来的AI智能振奋之外,大模型到底能给产业带来什么?以及AI大模型时代,产业需要的是什么?他们的大模型能力要如何与产业结合?我们也在警惕,这是否又是一次各大厂商之间花拳绣腿的AI技术武力值比拼。
只有当潮水退去的时候,我们才会知道谁在裸泳。
有媒体报道称截至今年7月,中国累计已经有130个大模型问世,数量超过美国进入大模型第一梯队。大模型被称为新一代基础设施,但到产业侧,很多企业并没有真正把大模型用起来。而没有用起来的原因主要还是政策没有开放,但是产业端的热情是非常高的,比C端更甚。
一家主打“消费内容+营销服务”公司的CEO王峰告诉雷峰网,现在业界有一个说法,未来互联网上90%的内容都是由AI生成的,这意味着大模型对他们业务的挑战和冲击是非常大的,所以他们必须早做应对。
为了应对此次冲击,他们今年年初从原来的各Team中抽调出一部分人,成立了AI Lab团队,做大模型方面的探索和尝试。
在王峰看来,通用大模型的学习和适应能力还是很强的,大家都看到了它如何惊艳,但也存在一定的局限,例如我们和GPT或国内模型对话时,问它怎么挑选茶叶的问题,它只会泛泛的告诉你要注意什么?很多时候,输出的内容并没能直接帮助消费者去做决策。
所以在王峰看来,大模型不是万能的,局限之一就是不能解决垂类问题,这是当前很多产业侧企业没能用起来大模型能力的原因之一。
但从0开始基础大模型的预训练,资金投入需要非常大,对于他们这样的企业来说不现实,而且对于很多企业来说即便有资金也能难做到,数据,算力,know-how,维护等等都是一道道门槛,所以只能寻求向市面上现有的大模型厂商合作。
国内模型能力的卖方可分为两类:一类是BAT等大厂和大模型初创公司为主;此外还有大模型的中间商,主要是基于大模型开发应用型服务的创始团队,包括底层算力与框架的提供者,甚至还包括提供大模型微调的第三方公司。
经过一番调研后,王峰决定训练自己的模型:在别的大模型上,把自己所服务行业的专业知识灌进去做进一步训练与微调,训练完后在本地进行私有部署,再来解决对应垂类问题。
但是在这个过程中,他们又发现不知道该用哪一家的模型:目前国内已发布的大模型数量太多,如果他们要将所有的模型都验证一遍、一一对比模型的效果,那么所消耗的人力成本会非常大。
事实上,B 端企业客户往往自带场景与数据,是大模型落地的最佳检验场。但当理论落地现实,王峰的困境也是许多B端企业所面临的共同难题。
所以,基于上述原因,导致目前国内的大模型与行业之间犹如隔着一道高墙,墙的一边大模型能力无法释放,另一边的数字化需求无法得到满足。而且基于开放数据集训练的大模型不擅长专业知识,掌握行业数据的企业用户无法参与大模型的建设。
为了最大程度拆掉这堵墙,释放大模型能力到产业侧,让掌握行业数据的企业用户真正参与到大模型建设中来,百度智能云提出了自己的解决思路:千帆大模型平台+解决方案+AI原生应用。
基于此,为了帮助企业和开发者快速基于基础大模型再训练,搭建企业专属大模型,百度智能云推出了百度智能云千帆大模型平台,在千帆平台上,用户可以直接调用包括文心一言在内的42个大模型服务,也可以在千帆上开发、部署和调用自己的行业大模型。
千帆大模型平台为企业提供了大模型开发全流程工具链和整套环境,用户可以完成从大模型开发、训练、部署、应用开发的各个环节,经过升级后的千帆2.0整套的工具链覆盖了大模型研发的全生命周期,包括:数据管理、模型训练、评估&优化、预测服务和Prompt工程,端到端地帮助企业高效地开发和部署大模型应用,不断降低大模型技术门槛。
百度智能云前期在进行市场调研时,发现很多企业客户,在基础大模型的选型策略上越来越专业、越来越理智。
原来他们了解一家大模型厂商的基础大模型实力时,就是通过看榜单排名,现在他们选择一家大模型时,要结合自身场景和数据去调优,会考虑很多,例如模型的效果、开发的效率、使用成本。所谓使用成本,例如资源占用,这个模型多大,需要占多少资源;性能怎么样;针对企业任务去做调优,调优成本怎么样,这些都是企业在选择基础模型时候考虑的因素。
发展到今天,产业上大家开始认真去考虑大模型作为基础设施,怎么给自己带来价值,而不是像早期仅仅只是凑热闹。
基于上述B端用户对大模型的认知情况,千帆平台为了满足不同用户的诉求,还接入了国内外42个主流大模型,方便用户根据自身业务细分场景进行选择。
上述能清晰认知自身大模型应用场景,并进行不同程度大模型开发的企业多集中于互联网行业,他们对技术、行业认知通常排在前列,所以只要给他们提供好的完善的工具链和整套环境就能在千帆平台上“自助”满足自己的大模型需求。但在一些传统行业,他们场景复杂,对大模型技术认知不够,还必须大模型厂商深入行业,陪着企业一起梳理大模型应用场景,将大模型能力用起来。
所以百度智能云在数字政府、金融、工业、交通四大行业专门基于大模型能力重构了解决方案。
1、百度智能云数字政府解决方案「九州」,针对政务大模型做了全面增强,包括知识增强、检索增强、认知迭代和安全策略增强。
2、百度智能云金融解决方案「开元」,基于开元重构的零售分析助手,能够助理财经理实时掌握客户动态,提供精准的业务洞察分析,基于业务目标智能推荐关键任务,并通过大模型生成千人千面的营销话术。
3、百度智能云工业解决方案「开物」基于文心大模型升级,新开物将实现从“产线智能 ” 到 “企业智能” 再到 “产业链智能” 的跨越与提升。
4、智能交通解决方案 ACE3.0 。基于大模型重新设计和优化后,交通组织方案获得更好的“诊疗效果”,覆盖范围更广。例如,过去,交警部门对抛洒物的检测很难做到精准识别,而大模型让这类事件的识别准确率有了很大提升。
上述四大解决方案,更多是百度智能云为了给客户和生态合作伙伴“打样”,因为千帆大模型平台期待未来能生态繁荣,越来越多用户聚集到该平台上来,既离不开客户,也离不开生态合作伙伴的共建,期待能长出更多丰富的解方案和产品。
除了四大⾏业垂直解决⽅案,百度智能云也看到⼤量客户的应⽤场景和业务需求是有共通之处的,他们把这些共性的需求归纳整理出来,正式推出适⽤于跨⾏业通⽤场景的AI原⽣应⽤Family,包括数字人百度智能云曦灵、企业搜索引擎臻知、安全生产智能助手度安安等等。这些应⽤覆盖了“服务营销、办公提效、⽣产优化”三个重点场景,百度一次发布了11个AI原生应用产品,满足不同行业的通用需求,加速大模型的规模落地。
他们也都是一个个“样板间”,意味着未来企业用户也有机会在千帆平台上开发出这样的AI原生应用。但同时不仅仅是样板间,因为也是满足行业通用场景需求的产品。
百度智能云发布自己的千帆大模型平台、行业解决方案、AI原生应用Family,从工具平台到产品,合作伙伴,全方位推动大模型应用,加速大模型的应用落地。
在此番大模型竞争中走平台模式打To B,不只百度智能云。
今年3月百度智能云千帆⼤模型平台发布上线。据百度智能云官方消息,今天千帆的⽉活企业数已经超过10000家,覆盖了 制造、能源、政务、交通这些⾏业超过400个场景。真正让很多企业感受到大模型的“智能力量”。
最直接的一个提效是,以前客户想要看⼀个⼤模型的效果,光是接⼊调试、验证评估等就需要算法团队投⼊⼀周的时间。现在在千帆⼀站式的⼯具链平台上,客户当天就可以跑通⼀个模型并且看到效果,快速进⼊⼤模型应⽤开发阶。
在雷峰网看来,百度智能云做对了几件事:
1)千帆平台拥有国内最多大模型,模型推理成本可降低50%。平台接入了Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等主流的42个大模型,用户可以根据不同的业务场景,选择⼀个或者多个⼤模型来⽤,实现“模型⾃由”。这是许多想要做大模型平台的厂商想要的效果,据雷峰网了解在一些大模型平台上还只有几家第三方大模型,剩下的全都是自家大模型。
这42家大模型都经过百度严格优选,不仅经过了模型效果、模型安全性、可商用三个维度的考核,还对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出。
但千帆又不只是简单地把大模型毫无意义地集中到一起充当一个“便利店”,而是对每一个接入的大模型都做了二次性能增强,包括:a、中文增强。针对国外主流大模型做了中文增强,像Llama2这样的国外大模型,原来要用英文对话效果才好,现在用中文也一样好。b、性能增强,可以全面提升训练和推理性能。训练LlaMA 2的总体吞吐可以提升25%,推理性能甚至可以提升2倍。c、对开源模型提供上下文增强,满足包括知识增强、长期记忆增强、文档知识问答在内的各种长上下文场景的推理需求。
2)千帆平台预置了41个数据集和10个精选应用范式。百度智能云在服务客户时,发现有大量客户觉得做模型微调时接入、管理数据太麻烦了,他们希望千帆平台上能提前预置一些好的数据集。鉴于这个需求,在升级后的千帆平台2.0上,预置了41个高质量的、有行业特色的数据集,用户只要点几个按钮就可以完成微调、提高模型效果。
选好模型后下一步就是应用开发,为了进一步提升大模型的应用开发效率,千帆平台提供了像知识问答、客服对话这样的10个精选应用范式。
IDC预测,2026年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。
每个掌握大模型自研能力的公司都想做大模型时代的基础设施运营商,几个月下来,行业目前只能确定,如果大模型真的是AI时代的智能运营商,如水电网等社会基础设施,无论现有的行业玩家再多,最终也只有少数几家能成功。
目前,国内大模型厂商主要包括百度、阿里、华为、腾讯、商汤这些企业,也有智源研究院、中科院自动化所等研究机构,同时英伟达等芯片厂商也纷纷入局。
在雷峰网看来,此番大模型时代的基础设施运营商的竞争中,百度的优势很明显。
首先是作为AI云厂商的机会。
对于很多做AI原生应用的企业来说,有一个很大的痛点就是推理成本很高。因为推理非常耗费资源,需要买很多机器,而且很难控制量,买多了浪费, 买少了推理能力跟不上用户的量。而这对云厂商来说却是一个很大的机会,因为云的特性就是弹性资源,云厂商可以通过规模化、技术优化的方式为这部分做AI原生应用的企业提供弹性的推理资源。
对于云厂商的机会,下到基础设施,上到AI应用。百度集团副总裁侯震宇在9.5号的云智大会上表示,⼤模型不同于以往的AI技术迭代 ,它驱动了底层IT基础设施的重构,也带来了上层应用开发模式的颠覆。
在千帆平台上,用户降低了对大模型的推理成本。只有降低了推理成本,才能使得大模型的应用规模化,让更多的人用起来,从而得到更多的反馈。
这要得益于百度“云智一体”战略:早在2020年,百度就率先提出的“云智一体”概念,以云计算为基础,以 AI 为引擎, 赋能千行百业。
同时,百度另一个优势在于百度对AI技术的积累和对AI场景的探索早于其他厂商。
早在2010年初,百度就开始探索人工智能,此后不断加大AI领域研发投入。彼时,鲜少有人能够预见AI未来的发展。但百度用千亿级的研发投入,显示出百度对技术的执念,也可以说百度在AI方向上赌对了。
其次,百度自身的业务底层就是由AI驱动,最新的AI技术百度通常能够先于其他厂商在内部快速大规模落地,所在面对用户时,百度的大模型能力天然具有说服力。到今天,搜索、网盘、数字人、如流等产品都通过生成式AI进行了重构。
百度的另一个优势是深入产业、躬身入局。从3月千帆平台发布以来,百度智能云的团队一共接触了400多个场景,每一个场景都投入了大量人力去支撑,了解客户的场景、用什么方法、效果怎么样、如何改进,拿到市场反馈后,基于这些反馈再快速地对千帆平台上的工具链进行迭代,形成正循环,不断优化平台。
北京宝兰德软件董事长易存道表示,如何把大模型在垂直行业做好,是目前各个企业都要考虑的问题,多数企业无法像百度一样有能力建设大模型。怎么能够把百度的大模型能力和企业业务有效结合起来,创造更强的价值,是企业非常好的弯道超车机会。
时至今日,我们可以感受到大模型技术变化太快,对企业来说,跟上潮流的成本很高,所以千帆平台通过帮助产业把底层平台建好、提供趁手的工具,以此来帮助增强企业使用大模型的能力,加快大模型大规模落地。同时,通过在AI大模型的布局与落地,通过千帆大模型平台与产业深度合作,释放“智能生产力”,百度自身也能穿越发展的“大周期”。