本报(chinatimes.net.cn)记者卢晓 北京报道
AI大模型的战火,在C端市场燃烧得更加炙热。
5 月 30 日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏当天对《华夏时报》等媒体记者这样表示,“目前我们希望做一个用户需要的东西。”
在这背后,虽然AI大模型讨论火热,但并未成为中小企业和普通用户的“刚需”。因此,在B端市场争相进入“免费时代”之后,AI大模型也正将触角伸向更广袤的C端市场。
加速落地C端
腾讯对元宝App的定位是全能AI助手。
相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等能力,面向日常生活场景,元宝还提供了多个特色AI应用,并新增了创建个人智能体等玩法。
此外,刘煜宏还告诉《华夏时报》等媒体记者,元宝也是一个连接器,连接了微信公众号、小程序、企业微信等腾讯内部所有生态,“元宝只是腾讯混元大模型的一个出口。腾讯内部不是all in大模型,而是大模型在任何一个产品里面。”
他披露的数字显示,目前腾讯内部已有600多个业务正式使用混元大模型,混元在其内部的调用量每天超过2亿次,此外腾讯现在有1/4左右的代码是AI来生成。
据记者了解,腾讯混元大模型在去年9月推出了小程序以及网页版。这些不同版本的底层能力一样,但面向不同的场景,其中小程序的使用量最轻,用完可以马上离开,APP的使用时长会稍长一些,网页版则面向需要重度创作的用户。
在持续推出不同应用背后,混元的底层模型持续迭代。
腾讯方面披露的数据显示,自去年9月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7万亿tokens,并升级为多专家模型结构(MoE),整体性能相比Dense 版本提升超50%。
而在多模态方面,据腾讯方面介绍,混元文生图大模型是业内首个中文原生DiT架构模型,采用了Sora、Stable Diffusion 3等行业顶尖产品的同款架构,生成效果相比上代提升超20%。据悉,目前该模型已经全面开源,在Github获得2000+star,相关能力也全面融入腾讯元宝。
不争一时之先
需要提及的是,虽然在生态和技术方面都有相对优势,但无论是混元大模型,还是混元大模型的App应用,腾讯在行业内推出的时间都不算早。
去年9月混元大模型亮相之前,百度的文心大模型、阿里的通义千问大模型、字节尚未改名为豆包的云雀大模型等均已面世。而在元宝App上线前,文心一言、通义、Kimi、豆包等诸多面向C端用户的应用也已发布。
刘煜宏在5月30日的采访中对《华夏时报》等媒体记者表示,腾讯一开始做大模型是希望满足内部的需求,在这个过程中发现很多能力用户和外面的企业也需要,所以才开放出来给大家用。他同时认为,大模型应用现在还是非常早期的阶段,“就算晚了三个月、晚了半年,拉长来看根本不是一个太重要的事情。”
支持他做出这个结论的一个重要论据是,作为一个自前年冬天火起来的AI风口,虽然热度一直居高不下,但大模型应用的渗透率目前并不高。刘煜宏举例称,现在大模型相关的AI应用去重之后,每家产品可能都说有几十万或者几百万的DAU(日活跃用户数量),但对整个互联网12亿人群来讲,渗透率可能不到1%,“我们要面向的是更大的市场或者更大的用户需求。”
对于AI大模型应用渗透率低的原因,多位业内人士在跟记者交流时都认为,一个重要原因在于大模型的现有能力还不能满足用户的实际需求,例如现在AI幻觉的问题相较早期有所进步,但还一直存在。事实上,从去年1月ChatGPT3.5发布,这个外界开始密集关注大模型的时间点粗略计算的话,AI大模型这个炽热风口也才吹了一年半左右的时间。
AI大模型应用渗透率低的另一个原因,在于应用场景还较窄。刘煜宏当天也对《华夏时报》等媒体记者表示,目前AI大模型应用集中在私人客服、搜索、辅助编码、文本总结等场景,而从过去一年多来腾讯内部几百个应用以及在小程序端看到的用户使用场景来看,“主要还是把混元当成一个大搜索去用。”
不急于商业化
AI大模型的商业化一直备受关注,但商业化并不是元宝App现在最重要的事情。
刘煜宏当天在被问及这个问题时表示,现在来谈整个大模型行业的商业化确实太早,还处于摸索的阶段。他同时提及,腾讯会把混元大模型的能力开放给腾讯会议、广告、腾讯云等产品,它们有自己的商业化路径,“但对于元宝App本身,我们暂时没有这方面的考虑。”
需要提及的是,在商业化程度更高的大模型B端市场,继字节的豆包大模型打响降价第一枪后,大模型厂商在这个5月掀起了激烈价格战,并跑步进入免费时代。有多位业内人士在跟记者交流时均认为,大模型厂商打价格战的目的更多的是为了培育市场认知,积蓄力量跑马圈地。
深度科技研究院院长张孝荣也在跟《华夏时报》记者交流时也认为,目前各家都在探索商业化道路,由于产业处于发展早期,依然是投入大产出少,需要大量烧钱,进一步完善技术创新,进而提升AI成熟度。
对于目前混元大模型的工作重点,刘煜宏表示,相较渗透率,混元更重视的是腾讯生态的覆盖率,即有多少个腾讯的产品在使用混元、产生价值,至于它调了一次还是十次,这个让产品来判断。
他同时提到,混元大模型目前为止从来没有去买量,未来会在付费推广等方面做尝试,但这并不是这个阶段的主要目标,甚至这个阶段的主要目标也不是对标竞品拉高整体的规模。
“大模型很烧钱,那么多人、那么多资源投进去,在腾讯里面产生什么价值,这个是我们要交出的答卷,我也一直在思考这个问题。这也是我们为什么要内部优先,一定让它产生价值。”刘煜宏说。